[問題] 卡方跟K-S的比較

看板Statistics作者 ( )時間12年前 (2013/08/14 12:06), 編輯推噓1(1026)
留言27則, 4人參與, 最新討論串1/1
假設我有兩組資料如下: d1 d2 d3 d4 d5 d6 d7 d8 d9 控制 21.8 47.7 65 142 245 350.5 478.3 643.1 818.7 實驗 11.4 52.1 52.8 173.3 285.1 394.2 521.3 727.3 879.7 我想比較這兩組的分配是否有差異 分別用了卡方檢定跟KS檢定 卡方我把控制組數據當成 期望值Ei 實驗組當成Oi 卡方值 = Σ(Oi-Ei)^2/Ei = 46.05 > X^2(0.95,8) p-value = 2.32232E-07 而K-S檢定 則是用SPSS的兩組獨立樣本比較 算出來的p-value是 1 我的問題是 這兩個方法算出來的p-value 有點天差地遠 我是覺得K-S的結果似乎比較合乎數據的樣子 是卡方的計算有問題嗎? 還請大家賜教,謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.109.32.9

08/14 17:04, , 1F
你做的二個檢定不是同一個目的啊.
08/14 17:04, 1F

08/14 17:19, , 2F
你要做 Kolmogorov-Smirnov Goodness-of-Fit Test 才是.
08/14 17:19, 2F

08/14 21:39, , 3F
嗯?我做的不是適合度檢定嗎? 就是比較兩組數據CDF的差異
08/14 21:39, 3F

08/14 21:40, , 4F
以最大的差異當做統計量 算出p-value?
08/14 21:40, 4F

08/16 08:33, , 5F
你可以自己檢查看看.
08/16 08:33, 5F

08/17 00:04, , 6F
這些數值代表的是d_i出現的頻率嗎? (i=1~9)
08/17 00:04, 6F

08/17 00:06, , 7F
更正: 不是頻率...= =
08/17 00:06, 7F

08/17 00:07, , 8F
不是頻率也不是次數...我也不曉得該怎麼做QQ
08/17 00:07, 8F

08/17 00:15, , 9F
這些值單純就是實驗出來的數據 是連續型的 所以不適合卡方?
08/17 00:15, 9F

08/17 00:46, , 10F
相同條件下重複九次實驗得到的九筆數據嗎?
08/17 00:46, 10F

08/17 01:48, , 11F
我說錯了. 你的KS是對的, 但誤用 chisq 了.
08/17 01:48, 11F

08/17 01:49, , 12F
多謝anovachen問了我沒注意的問題.
08/17 01:49, 12F
sorry 我自己都沒說清楚 我再詳細描述一下好了 事實上d1~d9是不同的天數 然後呢 其實每一天 都收集了repeat20次的data 而不同天的repeat 是獨立的 (也就是 沒有block) post上來的 是每天的平均值 這種型態的資料 一開始的想法當然是想用 重覆的two-way anova 但是 每天的變異數會不一樣 天數愈久 變異數就愈大 所以就不適合 再來從數據上看 隨著天數增加 不管實驗組或控制組 值都會愈來愈大 但這也是預料之中 真正有興趣的是想判斷出 實驗組跟控制組 的表現"pattern"是否一樣 或者說 實驗組數據的成長幅度 是否跟控制組一樣 因為最後就覺得不管怎樣 都是直接用平均值做比較 我就沒有把始末說這麼清楚 當時主要是想問為何K-S跟卡方的結果差異這麼大 所以目前看來 卡方是不適合的? 那K-S用在這個case上是OK的嗎? 或者有其他更適合的方法? 謝謝! ※ 編輯: eco100 來自: 118.166.213.21 (08/17 14:18)

08/18 12:04, , 13F
卡方 與 K-S 都不適用這資料!
08/18 12:04, 13F

08/18 12:05, , 14F
計量值反應, 可以考慮 "重複量測" 之分析. 最好用原始數據,
08/18 12:05, 14F

08/18 12:06, , 15F
不要直接算平均值再拿平均值分析.
08/18 12:06, 15F

08/18 12:07, , 16F
或許也可考慮 ANCOVA? 不過, 誤差變異之同質性, 及時間序列
08/18 12:07, 16F

08/18 12:08, , 17F
之相關性是問題. 又: 如果認為實驗組與控制組成立趨勢不同,
08/18 12:08, 17F

08/18 12:09, , 18F
則 ANCOVA 不適合.
08/18 12:09, 18F

08/18 12:45, , 19F
ANCOVA? 糟糕 不太熟 我會再做一下功課 謝謝老師
08/18 12:45, 19F

08/18 12:46, , 20F
那再請教一下 我有另外做t-test 其實就是每天的repeat
08/18 12:46, 20F

08/18 12:47, , 21F
分開做t-test 想說其中一天的p-value小於0.001的話
08/18 12:47, 21F

08/18 12:48, , 22F
這判斷 實驗組跟控制組pattern是不一樣的 這樣合理嗎?
08/18 12:48, 22F

08/18 12:55, , 23F
08/18 12:55, 23F

08/19 19:51, , 24F
ANCOVA是在兩組趨勢相同時比較兩組之差距. 但 "pattern" 或
08/19 19:51, 24F

08/19 19:52, , 25F
許應指兩組趨勢不同? 至於各日分別比較, 這是以各日結果看兩
08/19 19:52, 25F

08/19 19:53, , 26F
組是否有差異, 並不是 "pattern" 的差異.
08/19 19:53, 26F

08/20 09:50, , 27F
http://ppt.cc/wxjf 這是我把資料先用boxplot畫出來的樣子
08/20 09:50, 27F
文章代碼(AID): #1I2m9AQP (Statistics)