[其他] 移動平均觀念多問(統計/工程)

看板Math作者 (QQ)時間4年前 (2021/10/18 19:38), 4年前編輯推噓6(6036)
留言42則, 4人參與, 4年前最新討論串1/1
請問一下, 某個實數列a_n的移動平均(Moving average)有多種定義方式, 例如: https://en.wikipedia.org/wiki/Moving_average 這邊列舉一堆 想請問: (1) 這些定義跟E[a_n]有什麼關係?(E是期望值) 還是要討論它們的關係前, 要把a_n(w)定義為隨機過程才可以? 目前看起來ergodic process就能推得E[a_n] = 累積移動平均? (2) 工程上的paper有寫到說: (for any r€(0,1)) 藉由 s_n := (1-r)*s_(n-1) + r*(a_n-a_n-1) ---(*) 我們可以得到zero-mean version of E[a_n]...這到底在講什麼? 我都不管的話直接對(*)取期望值可以化簡得到 E[s_n] = 0 為什麼這個結果就是紅色那句話? 理論上紅色那句話應該要是 y_n = a_n - E[a_n] 吧 ------------------------------------------------------------- 總之工程上的論文只要理論是用隨機過程建模的, 實作時幾乎脫離不了移動平均 我提的這些問題是統計上的定義問題還是工程上的喜好問題呢...@@? 謝謝指教~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.231.108.253 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Math/M.1634557081.A.407.html

10/18 20:00, 4年前 , 1F
一個時間序列最單純的預測方式就是拿前幾期平均預測
10/18 20:00, 1F

10/18 20:01, 4年前 , 2F
E[a_n] 照定義還要知道他的分佈長什麼樣才能算
10/18 20:01, 2F

10/18 20:04, 4年前 , 3F
你的第(2)點 可以cite那篇paper嗎?
10/18 20:04, 3F

10/18 20:04, 4年前 , 4F
有沒有論文的前後文啊, 沒遇過不是很懂
10/18 20:04, 4F

10/18 21:23, 4年前 , 5F
我在想應該是在講mean-ergodic
10/18 21:23, 5F

10/18 21:23, 4年前 , 6F
把(*)兩邊除以n再取limit到無限大
10/18 21:23, 6F

10/18 21:42, 4年前 , 7F
可是一般moving-average不會取這麼長吧?
10/18 21:42, 7F
嗨c大ar大an大 截圖一下 https://imgur.com/bWZsCT0
論文出自於 https://arxiv.org/pdf/1602.08044.pdf 而我算是"舉個例子"而已, 因為工作上做了兩年半的audio算法 碰了很多訊號處理(DSP)的論文, 幾乎99%都是由統計模型&隨機過程來建模 然後用移動平均(最常就是exponential移動平均)去逼近期望值E[x_n] 但是這些年來我從論文都沒辦法去得到"為什麼這麼做"的答案 而從純理論出發又是數學語言實變, 這部分又跟論文的"口語解釋"對不起來 總之, 就是對於工程論文上的數學式都會去想 "為什麼要這麼做", "不這麼做可以嗎" blabla之類的數學解釋問題 然後就頭好痛QQ

10/18 22:56, 4年前 , 8F
右上角 2007, 但在 arxiv 上是 2016, 也太有趣
10/18 22:56, 8F

10/18 22:57, 4年前 , 9F
感謝, 有空來瞄一下.
10/18 22:57, 9F
2007沒錯, 只是IEEE要會員, 除非用S...^^" 看來是作者上傳到arxiv這個免費的平台XD

10/18 23:53, 4年前 , 10F
Sci-hub了解一下 貼IEEE的網址就能載
10/18 23:53, 10F

10/18 23:55, 4年前 , 11F
所以你想知道的是(*)怎麼得到它下面那一句
10/18 23:55, 11F

10/18 23:55, 4年前 , 12F
還是你想知道為什麼用這樣去近似mean?
10/18 23:55, 12F

10/18 23:57, 4年前 , 13F
不過做工程的思維是跟數學很不一樣
10/18 23:57, 13F

10/18 23:57, 4年前 , 14F
通常是方法有效 解釋後面補
10/18 23:57, 14F

10/18 23:58, 4年前 , 15F
方法沒效的話 paper早就胎死腹中 也不會需要解釋
10/18 23:58, 15F
所以我S才小聲說XDDD 至於我想知道的就是: (i) zero-mean version of power spectra 是否有嚴格定義 若有: 是什麼, 然後應該就能解決(ii)了, 而且是可以證明的 若沒有: 沒道理沒有, 不然就不會寫(17)式了 (ii) 為什麼(17)能達到" zero-mean version of power spectra " (iii) 為何要考慮zero-mean version? 只是這個答案我通常參考多個reference下來的回答也只是語言敘述而已... 比如為了去除DC成分, 那問題又變成為什麼要去除DC成分, 不去除會怎樣blabla..

10/19 00:43, 4年前 , 16F
那式子是1st order IIR high pass
10/19 00:43, 16F

10/19 00:46, 4年前 , 17F
如果本來a_n沒有低頻trend成分 或是選filter coe
10/19 00:46, 17F

10/19 00:46, 4年前 , 18F
fficient讓stop band趨近於零 那high pass基本上
10/19 00:46, 18F

10/19 00:46, 4年前 , 19F
就是demean囉
10/19 00:46, 19F
r大關於你敘述的這些應該都有定義與證明吧? 我大概敘述我遇到的邏輯問題: (反正實作都是實數列, 我就不用隨機過程敘述了) <Def1> We say a real sequence a_n is of zero-mean if E[a_n] = 0 <Def2> We say a real sequence b_n is a "demean" of real sequence a_n if ?????? <Theorem> Let a_n be a real sequence Then for any r€(0, 1) b_n:= (1-r)*b_(n-1) + r*(a_n-a_(n-1)) will be a "demean" of a_n 而接著注意: (1) <Def1>中的期望值是要用"某個moving average"去定義 還是把a_n看成隨機過程去用機率空間的期望值定義, 因人而異 假設選了某個, 接著看(2) (2) 我在論文, reference跟純數都找不到<Def2> (3) 如果有<Def1>, <Def2> 那<Theorem>可以證明吧?

10/19 08:37, 4年前 , 20F
bn is a high-passed version of an這樣講才比較
10/19 08:37, 20F

10/19 08:37, 4年前 , 21F
標準
10/19 08:37, 21F

10/19 08:47, 4年前 , 22F
高通濾波後 取剩下的震盪成分週期的公倍數內的時
10/19 08:47, 22F

10/19 08:47, 4年前 , 23F
域平均 當然就會是零了
10/19 08:47, 23F

10/19 08:53, 4年前 , 24F
這裡的1st order IIR filter只是高通濾波的特例
10/19 08:53, 24F

10/19 08:53, 4年前 , 25F
因為計算量少 所以實務上求方便常用(如果對濾波
10/19 08:53, 25F

10/19 08:53, 4年前 , 26F
rolloff等等沒那麼要求的話)
10/19 08:53, 26F
這些語言敘述有一致的數學定義嗎? 以我對DSP的理解 有砍低頻的都可以叫高通濾波器 再來回到原本的問題, 我如果定義 b_n 恆為0, 那也可以說是"de-mean" of a_n 不是嗎?(或是你說的high-pass) 如果不是的話, 代表<Def2>有嚴格的數學定義, 然後可以"證明" b_n=0不滿足 ※ 編輯: znmkhxrw (61.231.108.253 臺灣), 10/19/2021 10:59:34

10/19 11:12, 4年前 , 27F
把傅立葉變換最前面的常數拿掉 就是demean
10/19 11:12, 27F

10/19 11:14, 4年前 , 28F
實務上這不可能 濾波不會只影響一個傅立葉係數
10/19 11:14, 28F

10/19 11:16, 4年前 , 29F
算moving average後減掉 數學上就等價於用一個w
10/19 11:16, 29F

10/19 11:16, 4年前 , 30F
indow function做FIR filter
10/19 11:16, 30F

10/19 11:22, 4年前 , 31F
FIR比IIR需要更多計算量 但不管什麼filter都只是
10/19 11:22, 31F

10/19 11:22, 4年前 , 32F
demean的一個近似
10/19 11:22, 32F

10/19 11:25, 4年前 , 33F
近似得好不好就是看對其他傅立葉係數的影響 這就
10/19 11:25, 33F

10/19 11:25, 4年前 , 34F
有整套digital filter design理論討論各種tradeo
10/19 11:25, 34F

10/19 11:25, 4年前 , 35F
ff
10/19 11:25, 35F
喔喔!! 所以總結來說: <Def> 令x_t(w)為一隨機過程, X_f(w)為其傅立葉變換 令T函數把一個隨機過程打到另外一個隨機過程 若 T(x_t(w)) 的傅立葉轉換跟 X_f(w)一模一樣, 除了f=0的地方是0 那我們就稱做 T 是"demean" process 而實務上只能要"逼近", 而且不同實作方式與不同的input也有不同的效果 這方面並沒有數學證明, 所以才會有那麼多moving average的版本以及 各作者不同的實作方式?

10/19 11:35, 4年前 , 36F
bn恆為零就變成all stop啊XD 理想的high pass頻域
10/19 11:35, 36F

10/19 11:35, 4年前 , 37F
響應要是step function
10/19 11:35, 37F

10/19 11:40, 4年前 , 38F
可以證明啊 就是把各種filter的頻域響應算出來再
10/19 11:40, 38F

10/19 11:40, 4年前 , 39F
去一一檢視各種性質
10/19 11:40, 39F

10/19 11:45, 4年前 , 40F
嗯嗯! 不同的近似法(FIR, IIR)確實有不同的頻率響應 所以就是在理想濾波器無法達成的情況下, 各作者/實作用不同的近似法 之後看實驗結果, 好的就留下, 不好的就tune或是換, 大致上這樣@@? ※ 編輯: znmkhxrw (61.231.108.253 臺灣), 10/19/2021 14:09:36

10/19 15:20, 4年前 , 41F
要按照實際需求 在計算量/數值穩定性/對其他頻率
10/19 15:20, 41F

10/19 15:20, 4年前 , 42F
的影響之間作取捨
10/19 15:20, 42F
了解~謝謝r大的分享~~ ※ 編輯: znmkhxrw (223.136.14.20 臺灣), 10/19/2021 15:54:36
文章代碼(AID): #1XRLoPG7 (Math)