Re: [問題]中央極限定理的意義?

看板Statistics作者Altair ( )時間16年前 (2007/11/01 15:02)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串7/8 (看更多)

http://en.wikipedia.org/wiki/Central_limit_theorem Notes 1. For decades, large sample size was set as n > 29; however, research since 1990, has indicated larger samples, such as 100 or 250, might be needed if the population is skewed far from normal: the more skew, the larger the sample needed. The conditions might be rare, but critical when they occur: computer animations are used to illustrate the cases. The cutoff with n > 29 has allowed Student-t tables to format in limited pages; however, that sample size might be too small. See below "Using graphics and simulation.." by Marasinghe et al, and see "Identification of Misconceptions in the Central Limit Theorem and Related Concepts and Evaluation of Computer Media as a Remedial Tool" by Yu, Chong Ho and Dr. John T. Behrens, Arizona State University & Spencer Anthony, Univ. of Oklahoma, Annual Meeting of the American Educational Research Association, presented April 19, 1995, paper revised in Feb 12, 1997, webpage (accessed 2007-10-25): CWisdom-rtf. ※ 引述《yhliu.bbs@bbs.wretch.cc (老怪物)》之銘言： : 你的書只提到二項分布近似常態嗎? : 如果你的書提到 CLT 只談二項分布近似常態, 不看也罷! : 明明版上以前有討論過這主題的, 網路上隨便找一下也有 : 一堆,卻只是自以為是地認為 CLT 只適合對稱的二項分布, : 連不對稱的二項分布都被封殺!? : 即使只是最初等課程, 也不會只說對稱的二項分布才能近 : 似常態! 如果是這樣, 幾乎你所想用的任何統計方法都不 : 能用! : 我絕不敢說我懂 CLT, 但我不會隨便亂吹亂蓋. : CLT 之 "central" 本意如何我不敢斷言,但 "就是平均數" : 的說法絕難苟同! 倒是相互獨立且分散程度相差不大的隨 : 機變數相加, 其機率密度有向中心集中的傾向, 才是比較 : 合理的解釋. 簡單地看兩個骰子點數和、兩個指數變量相 : 加、兩個均勻變量相加就可得知. : 一堆不求甚解只會背書的學生, 加上一些外行充內行的作 : 者或教員, 造成一堆誤以為 "30" 是黃金數字的狂徒! 不 : 相信我對 "30以上是大樣本" 的批判? 去做做模擬吧! 拿 : 對數常態群體做看看? 拿 Pareto 分布群體做看看? 當然 : 這些都是 CLT 適用的例子! : 再說甚麼叫 "接近" 或 "近似" 常態? 誰給的近似標準? : 容忍誤差多少? 以甚麼方式測量近似的誤差? : "30" 這大小樣本的分界, 原本是常態群體之下的 t 變量 : 近似常態的一個不怎麼嚴格的暫用界限, 誰說可以毫無考 : 慮地拿來當是否引用 CLT 的界限? 即使用在 t 分布, 常 : 用顯著水準下, t 與標準常態的臨界點還存在不一定可忽 : 視的誤差! 這不是我隨口胡說, 任何人都可拿出 t 值表, : 比較 t(29) 或 t(30) 與 StdN 的常用臨界值, 看看所謂 : "近似" 究竟有多近似! : 而 t 分布是在常態群體下得到的分布! 這與 CLT 根本是 : 兩回事! 那 CLT 適用的 "樣本數 30" 根據是甚麼? 分明 : 是誤解加鬼扯! 有人做過模擬? 沒錯, 是有人做過, 只是 : 挑幾個乖寶寶型的群體, 再加上沒有客觀量測用於各種用 : 途產生的誤差而只是隨口說 "看起來不錯" 就算了? 不錯 : 個鬼啦! 可有人能告訴我 30 個 Pareto 變量的和正確分 : 布與常態分布會如何近似? : CLT 當然不限於 i.i.d. 情形, 隨便一本機率或統計教本 : 都應該有提及. 可是誰又能說 30 是大樣本? 是可以引用 : CLT 的界限? : 至於 "平均" 之於 CLT, 根本不是重點! CLT 是標準化變 : 量的特性. 是平均, 更是總和; 不是總和, 也不是平均! : 因為不標準化根本不可能有 CLT 結論. -- 為了學會英語, 我下了很大的功夫. 在有了一定的聽寫實力以後, 我堅持每天一定要聽寫A4的紙20頁, 不達目的絕不罷休, 即使下班晚了也要補上. 從1980年1月31日, 我開始奮發練習聽寫的那一天, 到三年後我調職為止, 我一共寫了一櫃子的A4紙, 用去一大把的原子筆, 聽壞了16台錄音機, 翻壞了兩本辭典. - 鍾道隆 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.126.51.176

‣ 返回看板[ Statistics ] 統計

‣ 更多 Altair 的文章

文章代碼(AID): #17ANeTYD (Statistics)