[問題] Chi-square test的期望值不可小於5?

看板Statistics作者 (北極熊)時間11年前 (2014/05/29 17:27), 編輯推噓0(0010)
留言10則, 3人參與, 最新討論串1/1
為什麼卡方檢定裡面的cell期望值不可小於5? 出處是什麼? 我看大家都這樣用,但是為什麼呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.71.94.11 ※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1401355663.A.59D.html

05/29 17:34, , 1F
因為要用常態近似. 是由於 cells 次數的聯合分布(多項分布)
05/29 17:34, 1F

05/29 17:35, , 2F
用多變量常態分布近似, 卡方統計量才會近似卡方分布.
05/29 17:35, 2F

05/29 17:36, , 3F
若 cell 的 expected counts 太低, 則難以引用常態近似.
05/29 17:36, 3F

05/29 17:57, , 4F
那為什麼是5?
05/29 17:57, 4F

05/29 18:51, , 5F
只是一個 rule of thumb.
05/29 18:51, 5F

05/29 18:55, , 6F
有興趣可以看G. Cochran (1954)這篇
05/29 18:55, 6F

05/29 18:58, , 7F
該作者指出期望值大於5會有比較好的approximation
05/29 18:58, 7F

05/31 10:21, , 8F
說 "比較好的近似"...該怎麼說呢? 比起期望值不到 5, 當然是
05/31 10:21, 8F

05/31 10:22, , 9F
"比較好". 但, 5 就夠了嗎? 只不過是個 rule of thumb, 只是
05/31 10:22, 9F

05/31 10:23, , 10F
前輩提出而當時同輩不反對, 後輩沿襲著用.
05/31 10:23, 10F
文章代碼(AID): #1JXlsFMT (Statistics)