[其他] 為何訊號處理要用隨機過程建模

看板Math作者znmkhxrw (QQ)時間4年前 (2021/09/11 11:18)推噓3(3推 0噓 26→)

留言29則, 4人參與討論串1/1

不好意思手機發文排版不太好, 想請教各位關於標題的一些想法, 困擾我兩年了...: ================================ 看AEC, ANC, beamforming...諸如這些訊號處理算法時對於數學式很頭痛, 不像原文書那樣假設,符號, 定義, 推論都很明確一般邏輯是先大致view他的數學式想表達什麼, 但是要複證時很容易出現說a式推到b式是依據某個reference, 而去找reference時他要馬又是引用某個reference, 要馬就是他的條件或是數學式跟引用他的文章對不上, 更痛苦的是馬上就冒出了某段psuedo code演算法, 然後聲稱這段算法就是在逼近或實作他的數學式... 尤其訊號處理的數學式幾乎都是用隨機過程建模的, 以及在處理期望值, 但卻又因為實務上真正的input根本只是某串已知的實數列, 比如某個人的聲音, 某首歌, 某段噪音, 或是某段模擬的訊號...而又有聽說一些神奇的說法: 1. 在進電腦前你根本不知道是什麼訊號 2. 電腦看到x_n時, 你永遠不知道x_n+1是什麼因此這裡就有兩個方向的問題: (1) 為什麼要用隨機過程建模? 這個方向就是會假設實數列x_n是某個隨機過程X_n(w)取某個事件w而得到的結果, 但是因為實務上只有拿到某串x_n, 所以在計算期望值時都只能假設這隨機過程是ergodic然後用各種moving average的方式去逼近期望值(更不用說有各種移動平均的定義, 每個定義哪可能都逼近到一樣的期望值), 而且論文的演算法也都只是在算x_n 也就是說, 我看不到建了這個隨機過程的好處是什麼, 反而還要為了這些建模假設一堆實務上看不到的東西, 比如w是不重要的, 機率空間是不重要的, 重要的是機率密度函數... 之類的說法 (2) 如果只是對x_n做實數列假設會怎樣嗎? 有諸多關於實數列定理描述如: 數列滿足什麼條件就會有什麼性質. 為什麼訊號處理不這樣就好了, 還很好驗證, 比如某個實訊號不滿足某個結論, 那他一定可以藉由某個定理去驗證說不滿足某個條件這些疑問導致兩個心得是: (a) 論文的理論推導跟演算法根本很難對上, 但是演算法卻有理論的"影子跟味道"...而實刻演算法卻又"大致上有效果", 所以又覺得他一定有道理在, 只是寫不清楚或是自己推導不出來而已 (b) 因為notation不清楚導致很難驗證他到底證的是否正確, 有時候x_n = X_n(w), 有時候又有x_n = X(w_n)的味道, 更有時候又加入了一些"文字型敘述的定理或假設"就直接說 a式推到b式, 但是去google這些關鍵字時, 這定理成立的前提也不一定原論文會滿足... =============================== 總之, 工作上從機器學習, 深度學習到訊號處理, 這些領域的建模都跟統計息息相關, 然後都是用隨機過程與期望值...所以看這些領域相關的論文都很痛苦, 為什麼不能像分析與代數領域的數學一樣定義, 假設, 推論都很明確, 統計這領域卻帶給我很多模糊的感覺 ...當然隨機過程的嚴格定義用抽象測度空間很明確沒錯, 但是面臨論文證明或是文字解釋時又會充斥著: 樣本空間不重要, w不重要, X_n(w)的c.d.f.才重要(通常會用假設的方式去說他有某個c.d.f., 可是你根本無法驗證你的x_n是否是這個c.d.f取出來的, 比如un iform distribution也是有可能都抽出一樣的點, 只是機率非常低)...等等這些似是而非的詞以上是我的困擾與看法, 再請有涉獵的人分享一下是不是我被卡在某個盲點或是有什麼re ference可以解決我的問題, 非常感謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.255.31 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Math/M.1631330310.A.116.html

→

recorriendo

09/11 13:08, 4年前 , 1^F

09/11 13:08, 1^F

→

recorriendo

09/11 13:09, 4年前 , 2^F

09/11 13:09, 2^F

推

recorriendo

09/11 13:11, 4年前 , 3^F

09/11 13:11, 3^F

→

recorriendo

09/11 13:11, 4年前 , 4^F

09/11 13:11, 4^F

我知道論文會把理論當已知, 而因為在業界了所以學習的方向變成缺什麼再從那個關鍵字決定要補什麼, 但是我就是很常遇到用論文的關鍵字所搜尋到的東西跟論文對不起來比如某式推得某式是因為大數定理, 那我就去查大數定理的嚴格敘述, 而光是要把論文的符號跟嚴格數學定理的符號對上就要猜不少時間(比如x, X, x_n, X_n), 更甚者其實那些定理的條件都不少, 我等於是要幫論文去下註解說他假設滿足這些條件即便以上事情都順了, 還是無法解決我原文的問題: 1. 如果不符合條件呢, 怎麼驗證符不符合條件? 因為我們無法"檢驗"隨機變數是否滿足條件, 因為拿到的資料都已經是取樣後的值 2. 不用隨機過程/變數的話可以嗎? 總之我相信全部都有嚴格定義跟假設下當然是對的, 只是論文在引用或書寫時以及聲稱用某個演算法能夠達到他的定理時, 我往往都對的很辛苦最後也是無法完美對上補充: 關於符號混亂這件事, 這邊有個例子是我以前詢問的 https://moptt.tw/p/Math.M.1516676320.A.723 花了好多時間在猜他是x還是X還是p(x)還是p(w), 然後因為有Radon Nikodym定理所以感覺換來換去也有道理, 但是此定理需要絕對連續的測度之類的條件, 我也沒看到論文有這些條件等於是說, 我只能假設論文是基於"everything behaves well"然後什麼定理都可以用... 而最後在實作的部分, 不管他寫的理論到底對還錯, 只要"聲稱"我這個演算法在實作那些理論, 並且實驗起來有效果, 那就是有效果, 可是我就是無法"證明"他的演算法取limit 會是理論值 ※ 編輯: znmkhxrw (111.255.239.106 臺灣), 09/11/2021 13:32:43

推

cuylerLin

09/11 14:38, 4年前 , 5^F

09/11 14:38, 5^F

→

cuylerLin

09/11 14:39, 4年前 , 6^F

09/11 14:39, 6^F

→

cuylerLin

09/11 14:39, 4年前 , 7^F

09/11 14:39, 7^F