Re: [問題]中央極限定理的意義?

看板Statistics作者yhliu.時間18年前 (2007/11/01 13:40)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串6/8 (看更多)

※ 引述《gloriosa.bbs@ptt.cc (Gix.Andy)》之銘言： > 我的理解是這樣不知道正不正確 > 常態分配是從二項分配取極限得到的 > 所以一個變數呈常態 > 表示這個變項背後的事實因子(我自己亂取的)出現正反的機會一樣你的書只提到二項分布近似常態嗎? 如果你的書提到 CLT 只談二項分布近似常態, 不看也罷! 明明版上以前有討論過這主題的, 網路上隨便找一下也有一堆,卻只是自以為是地認為 CLT 只適合對稱的二項分布, 連不對稱的二項分布都被封殺!? 即使只是最初等課程, 也不會只說對稱的二項分布才能近似常態! 如果是這樣, 幾乎你所想用的任何統計方法都不能用! 我絕不敢說我懂 CLT, 但我不會隨便亂吹亂蓋. CLT 之 "central" 本意如何我不敢斷言,但 "就是平均數" 的說法絕難苟同! 倒是相互獨立且分散程度相差不大的隨機變數相加, 其機率密度有向中心集中的傾向, 才是比較合理的解釋. 簡單地看兩個骰子點數和、兩個指數變量相加、兩個均勻變量相加就可得知. 一堆不求甚解只會背書的學生, 加上一些外行充內行的作者或教員, 造成一堆誤以為 "30" 是黃金數字的狂徒! 不相信我對 "30以上是大樣本" 的批判? 去做做模擬吧! 拿對數常態群體做看看? 拿 Pareto 分布群體做看看? 當然這些都是 CLT 適用的例子! 再說甚麼叫 "接近" 或 "近似" 常態? 誰給的近似標準? 容忍誤差多少? 以甚麼方式測量近似的誤差? "30" 這大小樣本的分界, 原本是常態群體之下的 t 變量近似常態的一個不怎麼嚴格的暫用界限, 誰說可以毫無考慮地拿來當是否引用 CLT 的界限? 即使用在 t 分布, 常用顯著水準下, t 與標準常態的臨界點還存在不一定可忽視的誤差! 這不是我隨口胡說, 任何人都可拿出 t 值表, 比較 t(29) 或 t(30) 與 StdN 的常用臨界值, 看看所謂 "近似" 究竟有多近似! 而 t 分布是在常態群體下得到的分布! 這與 CLT 根本是兩回事! 那 CLT 適用的 "樣本數 30" 根據是甚麼? 分明是誤解加鬼扯! 有人做過模擬? 沒錯, 是有人做過, 只是挑幾個乖寶寶型的群體, 再加上沒有客觀量測用於各種用途產生的誤差而只是隨口說 "看起來不錯" 就算了? 不錯個鬼啦! 可有人能告訴我 30 個 Pareto 變量的和正確分布與常態分布會如何近似? CLT 當然不限於 i.i.d. 情形, 隨便一本機率或統計教本都應該有提及. 可是誰又能說 30 是大樣本? 是可以引用 CLT 的界限? 至於 "平均" 之於 CLT, 根本不是重點! CLT 是標準化變量的特性. 是平均, 更是總和; 不是總和, 也不是平均! 因為不標準化根本不可能有 CLT 結論. -- H E L P !!! 統計專業版需要你 !!! 來貼文吧 !!! 無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區) 成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區) 盈月與繁星 telnet://ms.twbbs.org Statistics (統計：讓數字說話) 交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率) ★本文未經本人同意請勿轉載; 回覆請勿全文引用, 請僅留下直接涉及部分。 -- 夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87海

‣ 返回看板[ Statistics ] 統計

‣ 更多 yhliu. 的文章

文章代碼(AID): #17AMQy00 (Statistics)