Re: [問題] 區間估計的基本觀念釐清(二)

看板Statistics作者 (低調低調)時間14年前 (2011/10/06 23:27), 編輯推噓1(1017)
留言18則, 4人參與, 最新討論串2/2 (看更多)
※ 引述《sdtty (低調低調)》之銘言: : 我想對一未知母體的平均數作區間估計,抽完樣本後,發現以下問題: : 問題1.需要先對樣本作常態性檢定嘛? : 問題2.樣本符合常態性檢定當然是謝天謝地, : 但萬一樣本不符合常態性檢定,怎麼辦? (以下附上不知道正不正確的解決方法) : a.把樣本中的"離群值"踢掉,看看有沒有辦法湊出常態分配(可以這樣搞嘛?) : b.用轉換的方式把非常態轉換成常態(通常很難...且事後不好解釋) : c.假設母體為常態,大樣本用Z分配,小樣本用t分配(感覺不是很嚴謹...) : 以上兩個問題跟解決之道一直非常困擾我 : 希望能請版上大大指點 拜託了! 又出現一個問題... 目的:想對未知母體之平均數作區間估計 母體很大(有20000以上) 實驗步驟: step1.對母體進行抽樣大樣本(n=1000) step2.對抽樣的樣本進行常態性檢定 step3.若抽樣符合常態分配,一切ok 若抽樣不符合常態分配,依照CLT的理論,既然n已經大到1000了 所以樣本平均數會趨近於常態分配,就直接用常態來做吧! 自己的疑問:step2這個步驟不需要吧? 因為反正只要樣本夠大, 不論抽樣樣本是否符合常態, 我都可以直接用常態來做母體平均數的區間估計。 問題:我的想法是合理的嗎@@? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 111.252.153.144

10/06 23:38, , 1F
1000我想不用做常態性檢定了吧.. XD
10/06 23:38, 1F

10/06 23:48, , 2F
另外一個問題 依照yhliu教授所說在小樣本的情況下,即便作
10/06 23:48, 2F

10/06 23:49, , 3F
常態性檢定,不論樣本是否為常態,其意義都不大
10/06 23:49, 3F

10/06 23:49, , 4F
因此....不論我抽樣的樣本大或是小...都不需要做常態性檢定
10/06 23:49, 4F

10/06 23:50, , 5F
樣本大-->CLT可以證實趨近常態 樣本小->作常態檢定沒有意義
10/06 23:50, 5F

10/06 23:51, , 6F
這樣說...合理嗎XD
10/06 23:51, 6F

10/07 01:03, , 7F
我想問樓上為何不用@@例如年收入根本就不常態啊@@
10/07 01:03, 7F

10/07 08:06, , 8F
對阿 所以我的問題就在這裡XD
10/07 08:06, 8F

10/07 08:06, , 9F
如果大樣本...但是樣本不符合常態分配 還可以用Z分配來估計
10/07 08:06, 9F

10/07 08:07, , 10F
母體平均數的區間嘛?
10/07 08:07, 10F

10/07 12:08, , 11F
應該不行吧!你要用無母數統計才對
10/07 12:08, 11F

10/07 12:32, , 12F
假說檢定, 對於證明對立假說是有效的. 常態性檢定亦然. 除非
10/07 12:32, 12F

10/07 12:33, , 13F
樣本數夠大, 否則 "不棄卻常態性假說" 是否能證實群體接近常
10/07 12:33, 13F

10/07 12:34, , 14F
態, 都是值得懷疑的. 因此, 還不如直接看看常態性的QQ-plot.
10/07 12:34, 14F

10/07 12:35, , 15F
至於樣本數1000, 如果不做細分而只對整個群體做推論, 至少以
10/07 12:35, 15F

10/07 12:36, , 16F
之做 bootstrapping 應該是可以的. 而在絕大多數情形, 即使
10/07 12:36, 16F

10/07 12:36, , 17F
群體分布有不小的偏態, CLT 我個人猜測也是能適用. 但這只是
10/07 12:36, 17F

10/07 12:37, , 18F
猜測. 若欲證實, bootstapping 正是一個好方法.
10/07 12:37, 18F
文章代碼(AID): #1EZSZOs1 (Statistics)
文章代碼(AID): #1EZSZOs1 (Statistics)