Re: [機統] 估計母體平均觀念

看板Math作者 (妤欣)時間5年前 (2019/03/12 16:10), 編輯推噓0(009)
留言9則, 3人參與, 5年前最新討論串3/4 (看更多)
※ 引述《Vulpix (Sebastian)》之銘言: : ※ 引述《OfficeGL (妤欣)》之銘言: : : 一直搞不清楚估計 : : 看了原文書跟中文版越搞越模糊 : : 我的認知 : : 想要從有限樣本 n 來估計母體平均 : : 這個 n 實在混亂 : : 我認為 n 是每次sample的個數 : : 當然 n-> 無限大,那當然平均數會收斂到母體平均 : 到這裡為止,你用到的東西是「大數法則」。(前提是有母體平均。) : 不管是強版本還是弱版本,只要母體有平均, : 樣本平均就會以某種形式收斂到母體平均。 : : 而每次sample n筆會得到一次抽驗平均 : : X1, X2, X3, ... 一直抽樣下去 ... : : 而上述過程也是一個隨機變數 : : 我們叫做 K, K ~ Normal : 在這個階段,你用上了「中央極限定理」。 : 大致上是這個意思:[(X1+X2+...+Xn)/n-μ]/(σ/√n) 會收斂到標準常態分佈。 : 顯然,這次不只要有母體平均μ,母體標準差σ也不能是∞。 : 實務上常常會用這個想法: : (X1+X2+...+Xn)/n 差不多是一個常態分佈,平均μ、標準差σ/√n。 : : 而E[K]用來推估母體平均 : 你的 K 是什麼,我不太清楚,姑且先當作是 (X1+X2+...+Xn)/n 吧。 : 從上面可以知道 E[K] 就是μ,不是大概好像彷彿,兩個數字就是相等。 : 然後大數法則保證只要 n 很大,(X1+X2+...+Xn)/n 的抽樣值就很接近 E[K]。 : : VAR[K] 則表示上面式子的風險性高不高,有就是用來算信賴區間 : 信心水準約 68% 的信賴區間大概是 [μ-σ/√n, μ+σ/√n]。 : μ的估計方法已經找到了,問題在於我們不知道怎麼估計σ。 : 幸好,經過一番計算,E{ [(X1-K)^2+...+(Xn-K)^2]/(n-1) } = σ^2。 : 所以如果 n = 50 的話,只要重複取好多次 50 筆數據,我們就可以得到 σ^2 了! : 假設又要做 50 次的話,光是為了估算母體標準差,就要取 2500 筆數據…… : 先補一個假設:試驗的母體分佈應該沒有很爛,相信 E[X^4] 一定是存在的。 : 用 S^2 稱呼剛剛那一串 [(X1-K)^2+...+(Xn-K)^2]/(n-1) 吧。 : 第二個幸好,除了 E[S^2] = σ^2 以外, : 算一算可以得到 Var(S^2) = E[(S^2-σ^2)^2] = (E[X^4]-E[X]^4)/n, : (這個計算是好久以前算的了,有一點點不太確定,但是跟 n 成反比才是重點。) : 與 E[(K-μ)^2] = σ^2/n 類似,說明了 S^2 大致上只在 σ^2 附近閒逛。 : 所以 S^2 的取樣值,差不多就能直接當作 σ^2 的估計值了。 : 此即樣本標準差之所以為「樣本」「標準差」。 : : 可是我看題目 : : 都是例如抽50筆 : : 這50筆的平均跟標準差 就拿來估計信賴區間了 : : 這50筆不是只是一次抽樣而已嗎? : : 一次抽樣就可以估計母體? : : 不是應該要算E[K]跟Var[K]來估計信賴區間嗎? : 重點在於我們用到大數法則和中央極限定理,所以在 n 夠大的狀況下, : K 只在母體平均附近閒逛,跟 E[K] 根本差不多; : 而 Var[K] = σ^2/n,又 S^2 也只在 σ^2 附近閒逛, : 所以 Var[K] 幾乎就是 S^2/n 的取樣值,不用再平均(除非還想再提高近似程度)。 : : 有高手幫忙教學嗎~ : : 真的頭暈腦脹 : 這篇說到的所有近似都有程度的問題,理論上 n 愈大就近似得愈好。 謝謝你幫忙,雖然我描述的不是很看清楚 你卻能猜出來我要問的東西,真的很厲害 不過我有一點想再問 觀測一次 n筆samples的平均 x’ 根據中央極限定律 x’的分配服從常態分佈 且其期望值等於u就是母體平均 那應該是x’ 介於 [u-1.96sd, u+1.96sd] 到機率有95%這樣解釋 為何在區間估計時 反而是說 u 介於 [x-1.96sd, x+1.96sd] 有95%信賴區間? 這邊不懂 謝謝解說 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.222.53.190 ※ 文章網址: https://www.ptt.cc/bbs/Math/M.1552378223.A.EA4.html

03/12 16:25, 5年前 , 1F
因為參數落在區間的機率就是有跟沒有,機率是0跟1,
03/12 16:25, 1F

03/12 16:25, 5年前 , 2F
所以你只能用信心來看
03/12 16:25, 2F

03/12 16:29, 5年前 , 3F
就是樓上說的。這樣說吧,一個黑箱裡面兩個除了顏色
03/12 16:29, 3F

03/12 16:30, 5年前 , 4F
以外分不出來的球,一紅一白。抽出紅球的機率是1/2
03/12 16:30, 4F

03/12 16:32, 5年前 , 5F
抽一次球,抽到紅球的數目期望值是1/2。但是,真的
03/12 16:32, 5F

03/12 16:33, 5年前 , 6F
抽完一次,握在手中不看。你覺得手中的紅球有幾個?
03/12 16:33, 6F

03/12 16:34, 5年前 , 7F
只能是0或1,但我們其實不知道是哪個。
03/12 16:34, 7F

03/13 13:22, 5年前 , 8F
如果 x' 介於 u-d 和 u+d 之間, 那麼 u 不就介於
03/13 13:22, 8F

03/13 13:22, 5年前 , 9F
x'-d 與 x'+d 之間?
03/13 13:22, 9F
文章代碼(AID): #1SXsblwa (Math)
文章代碼(AID): #1SXsblwa (Math)