[問題] wilcoxon rank sum 或 mann-withney U …
我想請問的是 wilcoxon rank sum test
計算的p-value是否會受到sample大小的影響
我有兩個sample分別為 A, B 分別是由母群體 AA 和 BB 中取出的
目標是去檢定 SampleA 和 SampleB的分布 是否有明顯的不同
Ho = sampleA 和 sample B 的分布相同
sampleA, 及 sampleB的 大小完全取決於 這次我想從母體中取多少樣本出來
所以我第一次 各別取了 100 個
sampleA size = sampleB size = 100
利用軟體寄算p value
p-value ~ 0.3左右 --> 無法拒絕Ho
第二次 我各別由母體中取出 500個
sampleA size = sampleB size = 500
p-value ~ 0.052左右 --> 無法拒絕Ho
之後我試過 取1000, 5000, 10000等 ......
如果sampleA與sampleB 都各別取 10000個
p-value < 2*10^-16 --> 拒絕Ho
我想說怎麼這麼奇怪 p值 會因為我取的數量多少而改變
為了保險起見..我用了R 和 Matlab 進行同樣的計算
兩個軟體算出來的p value 都一樣
這樣不是很奇怪嗎 這問題困擾我快一個禮拜了
再者
我有將 sampleA 和 sampleB的分布用Excel畫出來 (sampleA, sampleB = 10000)
兩個看起來幾乎重疊, 若是計算重疊的面積也有95%
但是p value < 2*10^-16 .....拒絕Ho
... = =
所以上版請問大家 是否是我太蠢了忽略什麼東西
才會照成 p value 隨 sample size 變大而變小
而且是非常的小
請大家賜教了 感謝
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.19.9
※ 編輯: plankton 來自: 140.109.19.9 (12/09 19:12)
→
12/09 19:15, , 1F
12/09 19:15, 1F
推
12/09 19:43, , 2F
12/09 19:43, 2F
→
12/09 20:50, , 3F
12/09 20:50, 3F
→
12/09 20:50, , 4F
12/09 20:50, 4F
→
12/09 21:38, , 5F
12/09 21:38, 5F
→
12/09 21:39, , 6F
12/09 21:39, 6F
→
12/09 21:40, , 7F
12/09 21:40, 7F
→
12/09 21:41, , 8F
12/09 21:41, 8F
→
12/09 22:26, , 9F
12/09 22:26, 9F
→
12/09 22:50, , 10F
12/09 22:50, 10F
→
12/09 22:51, , 11F
12/09 22:51, 11F
→
12/09 22:52, , 12F
12/09 22:52, 12F
→
12/09 22:53, , 13F
12/09 22:53, 13F
→
12/09 22:54, , 14F
12/09 22:54, 14F
→
12/09 22:54, , 15F
12/09 22:54, 15F
→
12/09 22:55, , 16F
12/09 22:55, 16F
→
12/09 22:56, , 17F
12/09 22:56, 17F
→
12/10 00:25, , 18F
12/10 00:25, 18F
→
12/10 00:26, , 19F
12/10 00:26, 19F
→
12/10 00:27, , 20F
12/10 00:27, 20F
→
12/10 00:28, , 21F
12/10 00:28, 21F