[其他] 何謂"理解"了工程上的名詞或數學

看板Math作者znmkhxrw (QQ)時間3年前 (2022/05/12 03:07)推噓5(5推 0噓 83→)

留言88則, 4人參與討論串1/1

想了很久如何下標題...因為問題範圍有點廣不好意思, 先把常常寫在結尾的部分放到前面, 因為這些問題敘述起來比較沒有規則, 就是這幾年的工作遇到的困難跟經驗談我身邊的朋友要馬就是純工程出身, 要馬就是純數繼續在學界, 或是學界轉業界後就不在乎這些事情了因此我才會懷疑是否在工程上在乎跟理解這些事情是不需要的? (可是又覺得不太可能如此, 如果不理解, 那怎麼知道什麼時候要採用/避免? 該不會又回到了"先加再說", 效果好再解釋?) 文末分享一個讓我PO這篇文的最後一根稻草...頻譜洩漏或許板友們也可以分享如果是你遇到這個問題, 怎樣叫做理解了這個問題或是說知道這個問題的答案是什麼(我就是查不到formal math definition...) 想聽聽看各位板友的看法, 謝謝! ====================================================================== 大體來說, 我用以前在學界的"理解了"的標準來看待我工作上用到的名詞與數學從一年多的深度學習到現在三年的訊號處理, 不論是paper/工程的書/網路資料我覺得...好累...累到懷疑是不是我錯了不該拿以前那套邏輯思維套用在實務上的討論累的點完全不是在難, 而是在定義不清/不一致, 很多都是語言敘述或是舉例導致花一堆時間在猜東西/定義以及自我給定義然後逐個在猜測的定義下做推導, 看結果有沒有矛盾很大的可能是跟例子A一致, 但是又跟例子B牴觸, 於是又修正定義, 一直loop 這些年有問過不少人的看法, 工程上的朋友給出的說法大致是: 1.本來就不會寫清楚, 之後被質疑才有解釋的空間 (這個好像蠻常遇到的, 明明傅立葉轉換家族的定義跟假設不一樣然後彼此互相幫忙, 數學上對於這個家族間的關係其實都要有嚴格的假設才能相同or逼近的) 2.實務上很多是try出有結果後才去補數學式 3.本來就沒有嚴格/一致定義 4.審paper的人不會驗證數學式, 敘述邏輯跟結果合理就好 ...etc 這些說法每個都讓我大開眼界... 【工程paper】舉工程paper的格式來說, 大致上是: (1)介紹 (2)理論 (3)實作 (4)數據 (5)結論數學paper只是少掉(3)跟(4)而已接著以我的邏輯思維來說:((4),(5)不提了) (1) 介紹: 問題是什麼, 以前的模型有什麼問題, 這篇解決了什麼 (2) 理論: 對這個問題的數學建模是什麼, 推導出什麼結果 (3) 實作: 用什麼方式達到理論數學式以我看過的工程paper來說, (1)的內容多半是語言敘述, 這部分只要在(2)中給了明確的數學定義, 那就沒問題, 但是有些給有些不給, 所以這裡就要猜了再來猜最兇的就是(3)的部分, 幾乎沒有證明(2)跟(3)的關係, 僅口述說(3)實作(2) 所以我就在猜到底是: (a) 確實(3)是在實作(2), 只是證明trivial (b) 確實(3)是在實作(2), 只是證明很難 (c) 確實(3)是在實作(2), 只是他多假設了一些無法證明的東西 (比如期望值用移動平均實作, 假設這個方式可以逼近理論期望值) (d) 當初是先有(3)發現效果好, 再去補(2)來發paper 然後前面(a)~(c)的猜測, 就要花我一堆時間, 涉及: (i) 把實作部分還原成數學式 (ii) 把還原後的數學式跟理論數學式做比較(99%不相同) (iii) 自己猜條件&假設, 盡量把(ii)控制在某個誤差範圍內最後就不了了之, 因為原作者不在旁邊, 所有的一切只能自己猜跟驗證【我認為的討論邏輯/何謂理解了某個東西】今天要討論某個議題, 所有關於這個議題的辭彙都要有共識的定義, 才不會導致問題發散以及各說各話, 毫無交集以數學例子來說, 要討論傅立葉轉換的話, 就必須涉及: (1) 積分假設是什麼? 黎曼或是勒貝格 (2) 函數假設是什麼? 黎曼或是L^p (3) 是否為等價定義? 若不L^p怎麼辦? 詳細可參考L大的 https://www.ptt.cc/bbs/Math/M.1641311400.A.DB4.html 也就是說, 以上每個詞彙都有定義, 只差有沒有時間自己證一次而已我長年就是習慣這樣的思維(在學界跟教授與學生互動的經驗也支持這樣是對的) 所以如果這個議題有定義, 那就先確認彼此定義是什麼如果沒有定義, 那我們先一起把它定義出來以工程例子來說, 要討論取樣定理的話, 就必須涉及: (1) 訊號假設? (2) 何謂完美還原? 還原到誰? everywhere or almost everywhere? (3) 雙向無窮級數的定義? 是採用左右對稱還是各自跑? 是否等價? (4) 極限交換? 還是假設這函數很好, 在哪都可以交換? 而把這邏輯套到工程paper來說, 我就會先去抓該paper如何對問題做數學建模(數學目標式) 然後再看實作是如何逼近數學目標式我要求的只有這樣但是很多就是看不到或是加很多沒證明的因素比如回聲消除(AEC)的數學建模是假設傳輸路徑是LTI系統, 並且是係數是有限長的(FIR) 然後實作(演算法)就是要幫忙算出這些係數數學來說單純是做 f(w):= |Aw-b|^2 的梯度下降法而已但是看了很多在做AEC的paper確實都用同一套理論建模但是實作上卻各自加了很多因素, 聲稱可以幫助達到理論係數或是加速, (block處理, 加入統計量動態改變學習率...但沒證明這樣能達到什麼效果) 但是要馬沒給證明, 要馬就是證明的內容跟實作不符這時候我又花了不少時間在驗證上... 而且, 常常會發生語言敘述矛盾的地方以AEC的論文為例, 常在介紹中提到"若在雙講情況時沒停止學習率更新, 係數會發散掉" 然後我用最純的梯度下降(沒加任何變因)做實驗時根本沒有發散掉, 只是收斂速度慢而已然後我就卡住了, 不知道如何解決這個矛盾這又是我另外一個不舒服的地方...因為工程paper的理論往往使用隨機過程建模不是單純的"令x_n為定義在整數上的實數函數", 所以很容易覺得理論跟實作差很多只能相信他的實作在逼近理論, 也因此遇到像上述實驗上的矛盾也無從檢驗 (因為任何的實驗只是一次隨機過程的取樣而已) 最後就覺得, 如果這些矛盾沒有釐清, 這篇paper到底帶給我什麼知識? 【何謂頻譜洩漏(Spectral leakage), 為何加特殊窗可以減少頻譜洩漏】我這幾天去查相關資料, 9成都是用sine舉例的方式解釋, 參考wiki的第一張圖 https://en.wikipedia.org/wiki/Spectral_leakage (有藍紅線的那張) 然後我到處都查不到formal definition 可是接著想, 如果沒有定義, 那怎麼回答自己或是別人何謂頻譜洩漏... 如果有定義, 那我就可以驗證那些舉例是否符合定義, 以及加特殊窗是否會減少洩漏 (記得當線代助教時, 大一生在寫關於方陣AB=I則BA=I的證明時, 不少人就寫: 令A=I, B=I, 則因為AB=I, 所以BA=I...邏輯錯到傻住XD 舉例不能當作全部) 這邊題外話一下, 工程上的詞彙很容易遇到沒有正式定義, 但是可以瘋狂舉例而在意定義的人, 只能從海量的例子去自我定義出一個說服自己的定義... 這個問題以我所謂"理解了"的標準, 就要涉及: (縮寫: FT=連續傅立葉轉換, FS=傅立葉級數, DTFT=離散時間傅立葉轉換, DFT=離散傅立葉轉換) (1) 訊號假設? 是定義在整數x_n還是在實數x(t)? 是當作週期函數還是非週期函數? 非週期的話是假設有緊緻支撐還是沒有? (2) 何謂頻譜? 是採用FT/DTFT/FS/DFT? 如果用FT, 如果不是L^1的話要採用分布理論? (3) 何謂洩漏? 何謂降低洩漏? (4) 何謂特殊窗函數?(以例子來看是那些頭尾遞減到0的緊緻支撐函數) 當以上都well defined後, 就要能證明加特殊窗函數後就能降低洩漏當然啦, 我完全查不到(1)~(3)的定義, 查越多只是更多的舉例, 更遑論證明因此我就試著自己定義這些東西, 參考wiki那張圖, 我馬上就卡住了, 涉及: (a) wiki那張圖是對週期函數sine做FT, 這個用L^1的FT是不收斂的, 如果我要定義就要針對不同函數空間的FT做定義? (b) 洩漏如果定義在"頻譜"無法還原跟FT的結果一樣, 那所有函數都會洩漏 (c) 如果不是sine/cosine呢? 任何函數做週期延拓都是週期函數阿 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.102.225.191 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Math/M.1652296038.A.2F9.html ※ 編輯: znmkhxrw (59.102.225.191 臺灣), 05/12/2022 03:07:39

推

Vulpix

05/12 18:19, 3年前 , 1^F

05/12 18:19, 1^F

→

Vulpix

05/12 18:21, 3年前 , 2^F

05/12 18:21, 2^F

→

Vulpix

05/12 18:22, 3年前 , 3^F

05/12 18:22, 3^F

→

Vulpix

05/12 18:22, 3年前 , 4^F

05/12 18:22, 4^F

→

Vulpix

05/12 18:24, 3年前 , 5^F

05/12 18:24, 5^F

→

Vulpix

05/12 18:24, 3年前 , 6^F

05/12 18:24, 6^F

→

Vulpix

05/12 18:25, 3年前 , 7^F

05/12 18:25, 7^F

嗨V大~你的這些問號也是我的問號我就是覺得今天任何一份"頻譜洩漏"的資料他就要先給你那些問號是什麼, 也就是假設可是我卻花很多時間一個一個測試他的敘述到底是基於哪些問號就像是給一堆"x^n"的微分是"n*x^(n-1)"但是一直沒給微分的定義然後我就要花時間自己去猜出微分的定義...這不合理吧

→

Vulpix

05/12 18:27, 3年前 , 8^F

05/12 18:27, 8^F

→

Vulpix

05/12 18:29, 3年前 , 9^F

05/12 18:29, 9^F

→

Vulpix

05/12 18:29, 3年前 , 10^F

05/12 18:29, 10^F

→

Vulpix

05/12 18:30, 3年前 , 11^F

05/12 18:30, 11^F

如果wiki講明"頻譜我們採取FT, 而且是採用定義在分布理論上的FT" 或是你講的用PV, 我都可以接受並且後續再驗證

→

Vulpix

05/12 18:31, 3年前 , 12^F

05/12 18:31, 12^F

→

Vulpix

05/12 18:32, 3年前 , 13^F

05/12 18:32, 13^F

→

Vulpix

05/12 18:32, 3年前 , 14^F

05/12 18:32, 14^F

→

Vulpix

05/12 18:33, 3年前 , 15^F

05/12 18:33, 15^F

就是因為他用sine舉例才"看起來"有洩漏的感覺那其他週期函數如果有洩漏是怎樣呢? 這個問題也就是因為沒有定義洩漏 -------------------------------------------------------------------- V大針對你回的這些我想問一下, 為什麼歷史上這些詞彙就不能像數學定義那樣寫成:(以下有加一些猜的東西) <Definition> We say a function x:R→R has spectral leakeage if: (1) x is periodic with period p > 0 (2) F{x}(f) (FT defined by distribution theory) exists (3) by x_n:= f(nT), n = 0~N-1, T = p/N X_k:= FFT{x_n} we have X_k != F{x}(k*N*T) 就是類似寫成這樣, 那我就可以驗證是否加入窗函數就會降低洩漏但是工程上的詞彙我很少看到這種寫法, 所以我就會花一堆時間在猜定義原因就是目前根本沒有一致定義嗎?

推

Vulpix

05/12 22:04, 3年前 , 16^F

05/12 22:04, 16^F

→

Vulpix

05/12 22:06, 3年前 , 17^F

05/12 22:06, 17^F

→

Vulpix

05/12 22:08, 3年前 , 18^F

05/12 22:08, 18^F

→

Vulpix

05/12 22:09, 3年前 , 19^F

05/12 22:09, 19^F

→

Vulpix

05/12 22:10, 3年前 , 20^F

05/12 22:10, 20^F

→

Vulpix

05/12 22:11, 3年前 , 21^F

05/12 22:11, 21^F

→

Vulpix

05/12 22:12, 3年前 , 22^F

05/12 22:12, 22^F

→

Vulpix

05/12 22:14, 3年前 , 23^F

05/12 22:14, 23^F

→

Vulpix

05/12 22:15, 3年前 , 24^F

05/12 22:15, 24^F

→

Vulpix

05/12 22:15, 3年前 , 25^F

05/12 22:15, 25^F

→

Vulpix

05/12 22:17, 3年前 , 26^F

05/12 22:17, 26^F

→

Vulpix

05/12 22:17, 3年前 , 27^F

05/12 22:17, 27^F

推

Vulpix

05/12 22:21, 3年前 , 28^F

05/12 22:21, 28^F

→

Vulpix

05/12 22:22, 3年前 , 29^F

05/12 22:22, 29^F

V大你意思是說, 如果加窗函數y(t)=x(t)*w(t), 如果w(t)是恆為1的常數函數那y(t)就恆等於x(t), 因此x跟y的FT會一樣, 就毫無洩漏但是如果今天w(t)不是常數函數, 假設是有緊緻支撐的函數那自然x跟y的FT會不一樣, 這就是所謂的洩漏如果我沒有誤會你的意思的話, 直接你寫的標準差當定義, 馬上就遇到問題: x(t)如果是週期函數, FT就是一個泛函, 這樣標準差定義也會well-defined? 即便這個問題解決了, 這也就是我所謂"猜"的一種方式更何況像是wiki的圖畫出了FT, DTFT, DFT來解釋頻譜洩漏不僅僅只用了FT 感覺就是每個人對於頻譜洩漏可能有各自的定義但是直覺上好像都在表達一個無法有一致定義的自然現象?

推

PPguest

05/12 22:34, 3年前 , 30^F

05/12 22:34, 30^F

→

PPguest

05/12 22:40, 3年前 , 31^F

05/12 22:40, 31^F

→

PPguest

05/12 22:43, 3年前 , 32^F

05/12 22:43, 32^F

→

PPguest

05/12 22:45, 3年前 , 33^F

05/12 22:45, 33^F

→

PPguest

05/12 22:49, 3年前 , 34^F

05/12 22:49, 34^F

→

PPguest

05/12 22:51, 3年前 , 35^F

05/12 22:51, 35^F

→

PPguest

05/12 22:53, 3年前 , 36^F

05/12 22:53, 36^F

→

PPguest

05/12 22:55, 3年前 , 37^F

05/12 22:55, 37^F

嗨P大~對我就是覺得不可能這幾百年只有我遇到這種數學與工程的銜接問題所以都是以 "應該是對的只是我證不出來/證錯" 繼續花時間找資料但是幾年來做這些事覺得好像越來越不是這樣好像我在學界在乎跟使用的那套分析事務的邏輯在工程上不適用但是上網查也沒有相關的討論... 於是才想說不再浪費時間了問看看各位板友的意見

→