[問題] 卡方檢定的資料處理

看板Statistics作者 (夜露死苦)時間10年前 (2015/10/12 20:25), 編輯推噓0(0017)
留言17則, 3人參與, 最新討論串1/1
我目前在使用Apache的common math3的套件來作卡方檢定的程式實作。 我要檢定的是一群二維的點是否符合某bivariate normal distribution。 由於這個套件並沒有提共api算某個範圍的機率, 所以我把就每個點當作一個分類的格子,其對應的期望機率就用pdf來查。 也就是o = 1, e = pdf所給的機率值*1 此外,二維的點都是浮點表示,所以我假設不會有重複。 這樣做的卡方檢定是OK的嗎? 謝謝了。 -- 與怪物戰鬥的人,應當小心自己不要成為怪物。 當你遠遠凝視深淵時,深淵也在凝視你。 弗里德里希·威廉·尼采 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.23.156 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1444652710.A.490.html

10/12 22:01, , 1F
卡方的o和e都是次數, 不是機率。
10/12 22:01, 1F

10/12 22:04, , 2F
次數的觀測值和次數在H0下的期望值,說明確一點的話。
10/12 22:04, 2F

10/12 22:05, , 3F
所以你是把一個點都當「1次」這樣算下去嗎?
10/12 22:05, 3F

10/12 22:07, , 4F
在單變量常態的例子中也是要分個幾群來做。
10/12 22:07, 4F

10/12 22:08, , 5F
次數太少就不適卡方分配了,何況你都只有1次。
10/12 22:08, 5F

10/12 22:12, , 6F
我是把e的次數用機率乘上一來代表次數。
10/12 22:12, 6F

10/12 22:13, , 7F
我的確是把每次點都當一次來看待。看來還是得老老實實
10/12 22:13, 7F

10/12 22:14, , 8F
分類。更正,我是把機率乘上總共的觀測點數
10/12 22:14, 8F

10/12 22:15, , 9F
謝謝你的提點,感謝感謝
10/12 22:15, 9F

10/13 18:53, , 10F
(1) 卡方檢定是大樣本近似, 每個 cell 的期望次數不能太小.
10/13 18:53, 10F

10/13 18:53, , 11F
你的設定完全違背這個要求.
10/13 18:53, 11F

10/13 18:55, , 12F
(2) 連續型分布要用卡方檢定, 必然要分組. 因為, 單點的理
10/13 18:55, 12F

10/13 18:56, , 13F
論機率都是 0. 雙變量分布則不只單點機率是 0, 任一簡
10/13 18:56, 13F

10/13 18:57, , 14F
單曲線機率也是 0. 因此定要雙向分組才可能做卡方檢定.
10/13 18:57, 14F

10/13 18:58, , 15F
(3) p.d.f. 不是機率. 當然可以利用 p.d.f. 去計算近似機率
10/13 18:58, 15F

10/13 18:59, , 16F
但絕不是直接拿 p.d.f. 當機率用.
10/13 18:59, 16F

10/14 15:14, , 17F
再次感謝上面大德的指導。謝謝!
10/14 15:14, 17F
文章代碼(AID): #1M6wQcIG (Statistics)