[問題] wilcoxon rank sum 或 mann-withney U …

看板Statistics作者時間15年前 (2010/12/09 19:07), 編輯推噓1(1020)
留言21則, 4人參與, 最新討論串1/1
我想請問的是 wilcoxon rank sum test 計算的p-value是否會受到sample大小的影響 我有兩個sample分別為 A, B 分別是由母群體 AA 和 BB 中取出的 目標是去檢定 SampleA 和 SampleB的分布 是否有明顯的不同 Ho = sampleA 和 sample B 的分布相同 sampleA, 及 sampleB的 大小完全取決於 這次我想從母體中取多少樣本出來 所以我第一次 各別取了 100 個 sampleA size = sampleB size = 100 利用軟體寄算p value p-value ~ 0.3左右 --> 無法拒絕Ho 第二次 我各別由母體中取出 500個 sampleA size = sampleB size = 500 p-value ~ 0.052左右 --> 無法拒絕Ho 之後我試過 取1000, 5000, 10000等 ...... 如果sampleA與sampleB 都各別取 10000個 p-value < 2*10^-16 --> 拒絕Ho 我想說怎麼這麼奇怪 p值 會因為我取的數量多少而改變 為了保險起見..我用了R 和 Matlab 進行同樣的計算 兩個軟體算出來的p value 都一樣 這樣不是很奇怪嗎 這問題困擾我快一個禮拜了 再者 我有將 sampleA 和 sampleB的分布用Excel畫出來 (sampleA, sampleB = 10000) 兩個看起來幾乎重疊, 若是計算重疊的面積也有95% 但是p value < 2*10^-16 .....拒絕Ho ... = = 所以上版請問大家 是否是我太蠢了忽略什麼東西 才會照成 p value 隨 sample size 變大而變小 而且是非常的小 請大家賜教了 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.109.19.9 ※ 編輯: plankton 來自: 140.109.19.9 (12/09 19:12)

12/09 19:15, , 1F
請問 wilcoxon 有規定我sample的分布必須是對稱的嗎?
12/09 19:15, 1F

12/09 19:43, , 2F
要是無母數方法還有規定分配的樣子的話...那幹麼叫無母數
12/09 19:43, 2F

12/09 20:50, , 3F
可是前面文章有人回答 wilcoxon是要用在連續的對稱分佈
12/09 20:50, 3F

12/09 20:50, , 4F
文章代碼 #13Xz2-00
12/09 20:50, 4F

12/09 21:38, , 5F
誰說無母數方法就不要對群體做假設?
12/09 21:38, 5F

12/09 21:39, , 6F
兩樣本 Wilcoxon 檢定的導出, 是假設兩群體只是 "平移" 的
12/09 21:39, 6F

12/09 21:40, , 7F
差異. 只是實際應用上沒那麼嚴格而已.
12/09 21:40, 7F

12/09 21:41, , 8F
要求群體分布對稱的, 那是單一樣本的檢定.
12/09 21:41, 8F

12/09 22:26, , 9F
p值一直都是應樣本數不同而不同. 你可能誤會p值意義了.
12/09 22:26, 9F

12/09 22:50, , 10F
不好意思 那再請問一下 如果對稱分布是針對單一樣本檢定
12/09 22:50, 10F

12/09 22:51, , 11F
那不同樣本檢定是否有任何限制? 我有查道說 兩樣本的分布
12/09 22:51, 11F

12/09 22:52, , 12F
必須是相同的... 請問是這樣嗎?
12/09 22:52, 12F

12/09 22:53, , 13F
還有很不好意思 我不知道原來p value會隨樣本數量改變
12/09 22:53, 13F

12/09 22:54, , 14F
我本來以為只要是來是相同的母群體 不論樣本大小p value
12/09 22:54, 14F

12/09 22:54, , 15F
都會相同
12/09 22:54, 15F

12/09 22:55, , 16F
如果 p value 會隨sample size改變 而改變
12/09 22:55, 16F

12/09 22:56, , 17F
那我怎麼知道我 p-value 要設定小於多少 才能拒絕Ho??
12/09 22:56, 17F

12/10 00:25, , 18F
p-value 隨樣本增大而變小, 是兩群體有差異的徵象. 但兩群體
12/10 00:25, 18F

12/10 00:26, , 19F
或兩樣本分布畫圖顯示重疊度高, 則該差異是否具實質重要性是
12/10 00:26, 19F

12/10 00:27, , 20F
待商榷之事.
12/10 00:27, 20F

12/10 00:28, , 21F
判定 p-value 是否夠小的顯著水準,其決定應獨立於樣本數之外
12/10 00:28, 21F
文章代碼(AID): #1D0BXlbf (Statistics)