[其他] 為何訊號處理要用隨機過程建模

看板Math作者 (QQ)時間2年前 (2021/09/11 11:18), 2年前編輯推噓3(3026)
留言29則, 4人參與, 2年前最新討論串1/1
不好意思手機發文排版不太好, 想請教各位關於標題的一些想法, 困擾我兩年了...: ================================ 看AEC, ANC, beamforming...諸如這些訊號處理算法時對於數學式很頭痛, 不像原文書那 樣假設,符號, 定義, 推論都很明確 一般邏輯是先大致view他的數學式想表達什麼, 但是要複證時很容易出現說a式推到b式是 依據某個reference, 而去找reference時他要馬又是引用某個reference, 要馬就是他的 條件或是數學式跟引用他的文章對不上, 更痛苦的是馬上就冒出了某段psuedo code演算 法, 然後聲稱這段算法就是在逼近或實作他的數學式... 尤其訊號處理的數學式幾乎都是用隨機過程建模的, 以及在處理期望值, 但卻又因為實務 上真正的input根本只是某串已知的實數列, 比如某個人的聲音, 某首歌, 某段噪音, 或 是某段模擬的訊號...而又有聽說一些神奇的說法: 1. 在進電腦前你根本不知道是什麼訊號 2. 電腦看到x_n時, 你永遠不知道x_n+1是什麼 因此這裡就有兩個方向的問題: (1) 為什麼要用隨機過程建模? 這個方向就是會假設實數列x_n是某個隨機過程X_n(w)取某個事件w而得到的結果, 但是因 為實務上只有拿到某串x_n, 所以在計算期望值時都只能假設這隨機過程是ergodic然後用 各種moving average的方式去逼近期望值(更不用說有各種移動平均的定義, 每個定義哪 可能都逼近到一樣的期望值), 而且論文的演算法也都只是在算x_n 也就是說, 我看不到建了這個隨機過程的好處是什麼, 反而還要為了這些建模假設一堆實 務上看不到的東西, 比如w是不重要的, 機率空間是不重要的, 重要的是機率密度函數... 之類的說法 (2) 如果只是對x_n做實數列假設會怎樣嗎? 有諸多關於實數列定理描述如: 數列滿足什麼條件就會有什麼性質. 為什麼訊號處理不這 樣就好了, 還很好驗證, 比如某個實訊號不滿足某個結論, 那他一定可以藉由某個定理去 驗證說不滿足某個條件 這些疑問導致兩個心得是: (a) 論文的理論推導跟演算法根本很難對上, 但是演算法卻有理論的"影子跟味道"...而 實刻演算法卻又"大致上有效果", 所以又覺得他一定有道理在, 只是寫不清楚或是自己推 導不出來而已 (b) 因為notation不清楚導致很難驗證他到底證的是否正確, 有時候x_n = X_n(w), 有時 候又有x_n = X(w_n)的味道, 更有時候又加入了一些"文字型敘述的定理或假設"就直接說 a式推到b式, 但是去google這些關鍵字時, 這定理成立的前提也不一定原論文會滿足... =============================== 總之, 工作上從機器學習, 深度學習到訊號處理, 這些領域的建模都跟統計息息相關, 然 後都是用隨機過程與期望值...所以看這些領域相關的論文都很痛苦, 為什麼不能像分析 與代數領域的數學一樣定義, 假設, 推論都很明確, 統計這領域卻帶給我很多模糊的感覺 ...當然隨機過程的嚴格定義用抽象測度空間很明確沒錯, 但是面臨論文證明或是文字解 釋時又會充斥著: 樣本空間不重要, w不重要, X_n(w)的c.d.f.才重要(通常會用假設的方 式去說他有某個c.d.f., 可是你根本無法驗證你的x_n是否是這個c.d.f取出來的, 比如un iform distribution也是有可能都抽出一樣的點, 只是機率非常低)...等等這些似是而非 的詞 以上是我的困擾與看法, 再請有涉獵的人分享一下是不是我被卡在某個盲點或是有什麼re ference可以解決我的問題, 非常感謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.255.31 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Math/M.1631330310.A.116.html

09/11 13:08, 2年前 , 1F
因為你讀的是論文 不是書
09/11 13:08, 1F

09/11 13:09, 2年前 , 2F
論文就是要展現新的成果 不是慢慢來從基礎建立理論
09/11 13:09, 2F

09/11 13:11, 2年前 , 3F
想要懂理論請去找statistical signal processing
09/11 13:11, 3F

09/11 13:11, 2年前 , 4F
的書看
09/11 13:11, 4F
我知道論文會把理論當已知, 而因為在業界了所以學習的方向變成缺什麼再從那個關鍵字 決定要補什麼, 但是我就是很常遇到用論文的關鍵字所搜尋到的東西跟論文對不起來 比如某式推得某式是因為大數定理, 那我就去查大數定理的嚴格敘述, 而光是要把論文的 符號跟嚴格數學定理的符號對上就要猜不少時間(比如x, X, x_n, X_n), 更甚者其實那些 定理的條件都不少, 我等於是要幫論文去下註解說他假設滿足這些條件 即便以上事情都順了, 還是無法解決我原文的問題: 1. 如果不符合條件呢, 怎麼驗證符不符合條件? 因為我們無法"檢驗"隨機變數是否滿足 條件, 因為拿到的資料都已經是取樣後的值 2. 不用隨機過程/變數的話可以嗎? 總之我相信全部都有嚴格定義跟假設下當然是對的, 只是論文在引用或書寫時以及聲稱用 某個演算法能夠達到他的定理時, 我往往都對的很辛苦最後也是無法完美對上 補充: 關於符號混亂這件事, 這邊有個例子是我以前詢問的 https://moptt.tw/p/Math.M.1516676320.A.723 花了好多時間在猜他是x還是X還是p(x)還是p(w), 然後因為有Radon Nikodym定理所以感 覺換來換去也有道理, 但是此定理需要絕對連續的測度之類的條件, 我也沒看到論文有這 些條件 等於是說, 我只能假設論文是基於"everything behaves well"然後什麼定理都可以用... 而最後在實作的部分, 不管他寫的理論到底對還錯, 只要"聲稱"我這個演算法在實作那些 理論, 並且實驗起來有效果, 那就是有效果, 可是我就是無法"證明"他的演算法取limit 會是理論值 ※ 編輯: znmkhxrw (111.255.239.106 臺灣), 09/11/2021 13:32:43

09/11 14:38, 2年前 , 5F
這個就是理論與實務(至少在臺灣)巨大的差距,實務
09/11 14:38, 5F

09/11 14:39, 2年前 , 6F
上在意的是一個東西「堪不堪用」(i.e., 在大多數情
09/11 14:39, 6F

09/11 14:39, 2年前 , 7F
況它都是對的,且業界其他人也都是這樣用的話,儘管
09/11 14:39, 7F

09/11 14:39, 2年前 , 8F
它跟理論有所出入也會被接受,甚至開始脫離理論的嚴
09/11 14:39, 8F

09/11 14:39, 2年前 , 9F
謹度),所以對這些人來說發表新論文的方法就是不斷
09/11 14:39, 9F

09/11 14:39, 2年前 , 10F
地引用前人的成果、調整一些參數達到「更好的」表現
09/11 14:39, 10F

09/11 14:39, 2年前 , 11F
,基本上不會有人在意當出錯的時候該怎麼辦?這不是
09/11 14:39, 11F

09/11 14:39, 2年前 , 12F
主流實務導向的人會在意的問題。如果你真的要有什麼
09/11 14:39, 12F

09/11 14:39, 2年前 , 13F
完備或系統化的訓練,且最終目標是「真正創造出新的
09/11 14:39, 13F

09/11 14:39, 2年前 , 14F
東西」的話,就是要從高等微積分、測度高等機率、隨
09/11 14:39, 14F

09/11 14:39, 2年前 , 15F
機過程、訊號處理、小波分析等地方出發了解,再慢慢
09/11 14:39, 15F

09/11 14:39, 2年前 , 16F
堆疊一定成熟的能力。
09/11 14:39, 16F

09/11 20:11, 2年前 , 17F
因為方便啊
09/11 20:11, 17F

09/11 21:23, 2年前 , 18F
我覺得可以想成如果要發表一個實用的演算法, 最重要
09/11 21:23, 18F

09/11 21:23, 2年前 , 19F
的點應該是他在某些情況比現在已知的演算法表現好
09/11 21:23, 19F

09/11 21:24, 2年前 , 20F
理論只是用來解釋怎麼想到要這樣算的, 即使這個演算
09/11 21:24, 20F

09/11 21:26, 2年前 , 21F
法的極限, 可以證明跟理論值之間有誤差, 也就是有
09/11 21:26, 21F

09/11 21:26, 2年前 , 22F
理論上的bias, 只要在它的應用範圍內這個bias不重要
09/11 21:26, 22F

09/11 21:26, 2年前 , 23F
人家一點也不會在意
09/11 21:26, 23F

09/11 22:59, 2年前 , 24F
嚴格的條件是數學證明上有用 實務上不會一個一個驗
09/11 22:59, 24F

09/11 22:59, 2年前 , 25F
證 統計信號處理基本上統計的部分就是noise model
09/11 22:59, 25F

09/11 22:59, 2年前 , 26F
暴力的驗證法就是直接量真實的noise和用假設的noi
09/11 22:59, 26F

09/11 22:59, 2年前 , 27F
se model模擬出來的理論noise比對機率分佈
09/11 22:59, 27F

09/11 22:59, 2年前 , 28F
不暴力的驗證法通常是針對特定性質的test 例如最基
09/11 22:59, 28F

09/11 22:59, 2年前 , 29F
本的stationary就有好幾種tests可供選擇
09/11 22:59, 29F
文章代碼(AID): #1XF2064M (Math)