[問題] Mcnemar細格問題

看板Statistics作者 (大玄)時間4年前 (2021/05/05 11:04), 4年前編輯推噓0(0062)
留言62則, 3人參與, 4年前最新討論串1/1
大家好, 努力爬文查詢都還是不曉得如何解決,再請高手們幫幫忙謝謝> < 我的資料為類別資料 2*5 查詢到前後測的資料需跑Mcnemar檢定 但是我前測有1細格為0 所以跑SPSS時跑不出值 想請問遇到此情形該如何解決,謝謝!! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.53.129.141 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1620183886.A.69A.html

05/05 13:54, 4年前 , 1F
McNemar 檢定小樣本直接用二項分布計算.
05/05 13:54, 1F

05/05 13:55, 4年前 , 2F
不懂你的 "資料為類別資料 2*5" 是何意? 是5個配對? 這樣
05/05 13:55, 2F

05/05 13:57, 4年前 , 3F
的小樣本不適合用常態近似. 而這麼小的樣本也很難獲得有
05/05 13:57, 3F

05/05 13:58, 4年前 , 4F
意義的結論---很難達到統計顯著性.
05/05 13:58, 4F

05/05 14:33, 4年前 , 5F

05/05 14:34, 4年前 , 6F
是想表達↑這個意思才對,想請問您知道這該如何處理嗎~
05/05 14:34, 6F

05/05 14:34, 4年前 , 7F
? 謝謝
05/05 14:34, 7F
※ 編輯: s50706123 (27.53.129.141 臺灣), 05/05/2021 14:36:36

05/05 16:28, 4年前 , 8F
我猜5是5類outcome,但注意有序或無序會是不同方法處理
05/05 16:28, 8F

05/05 16:29, 4年前 , 9F
看到原po補上的說明,更困惑了。
05/05 16:29, 9F

05/05 16:31, 4年前 , 10F
原po還是看一看mcnemar的教學,次數不會整理成這樣
05/05 16:31, 10F

05/05 16:32, 4年前 , 11F
而會是6*6的方矩陣。
05/05 16:32, 11F

05/05 16:33, 4年前 , 12F
不過如此一來勢必一大堆cell值太小。考慮exact或permute
05/05 16:33, 12F

05/05 16:33, 4年前 , 13F
並留意1-6選擇是有序或無序。
05/05 16:33, 13F

05/05 17:18, 4年前 , 14F
抱歉抱歉,是要整理成這樣呈現才對,剛剛傳的時候忘記>
05/05 17:18, 14F
※ 編輯: s50706123 (27.53.129.141 臺灣), 05/05/2021 17:26:31

05/05 17:27, 4年前 , 15F

05/05 17:29, 4年前 , 16F
請問A大如果是成對樣本資料,也能使用exact嗎@@?
05/05 17:29, 16F

05/05 17:31, 4年前 , 17F
可以。不過我不用spss,但看一下手冊應是可行但要寫指令
05/05 17:31, 17F

05/05 17:40, 4年前 , 18F
不好意思,請問是指 Fisher's exact test對嗎~?
05/05 17:40, 18F

05/05 17:42, 4年前 , 19F
不是。我們都在討論Marginal Homogeneity Tests,其中若
05/05 17:42, 19F

05/05 17:42, 4年前 , 20F
只有二類outcome就是McNemar test,和fisher exact無關
05/05 17:42, 20F

05/05 17:46, 4年前 , 21F
嚴格來說,你要做 Stuart(-Maxwell) test 的 exact或
05/05 17:46, 21F

05/05 17:47, 4年前 , 22F
permutation方法。若是有序outcome則是Birch test。
05/05 17:47, 22F

05/05 17:52, 4年前 , 23F
原來如此!! 那我查查看 Stuart(-Maxwell) test ,真的
05/05 17:52, 23F

05/05 17:52, 4年前 , 24F
非常感謝您 > <"
05/05 17:52, 24F

05/06 11:11, 4年前 , 25F
McNemar test 是成對2元反應資料, 多元反應資料一般考慮兩
05/06 11:11, 25F

05/06 11:13, 4年前 , 26F
種一般化, 一是如上所說的邊際均齊性, 在前後測資料即是
05/06 11:13, 26F

05/06 11:15, 4年前 , 27F
後測與前測之邊際分布相同; 另一是對稱性, 即 i→j 與 j→i
05/06 11:15, 27F

05/06 11:16, 4年前 , 28F
的比什例皆相同. 但實務上不一定要限制在這兩方面. 以所整
05/06 11:16, 28F

05/06 11:18, 4年前 , 29F
理出來的結果看起來, 似乎傾向於 i→i-1. 變數之分類如係
05/06 11:18, 29F

05/06 11:20, 4年前 , 30F
順序型, 這種變化具有實務上的意義. 至於統計上的顯著性,
05/06 11:20, 30F

05/06 11:21, 4年前 , 31F
因樣本太小, 不適合用大樣本方法, 但是否有合適的軟體可做
05/06 11:21, 31F

05/06 11:22, 4年前 , 32F
exact test, 我不清楚.
05/06 11:22, 32F

05/06 12:57, 4年前 , 33F
我想即使沒有軟體可用, 也可以人工計算. 有兩組 test 可做.
05/06 12:57, 33F

05/06 12:59, 4年前 , 34F
其一: i→i-1 的比例 p, H0: p = 1/6, H1: p > 1/6;
05/06 12:59, 34F

05/06 13:00, 4年前 , 35F
其二: i→j<i-1 的比例 p1 vs. i→j>i-1 的比例 p2.
05/06 13:00, 35F

05/06 13:02, 4年前 , 36F
不過, 這兩個 test 是在 "資料偷窺" 後建立的, 其結果就是
05/06 13:02, 36F

05/06 13:04, 4年前 , 37F
nominal error 遠低於 actual error, 例如採 1% 顯著水準,
05/06 13:04, 37F

05/06 13:05, 4年前 , 38F
名義上是 type 1 error 發生機率不超過 1%, 實際上可能甚至
05/06 13:05, 38F

05/06 13:07, 4年前 , 39F
超過 5%. 至於計算, 以第一個 test 而言, 就是 i→j-1 的
05/06 13:07, 39F

05/06 13:08, 4年前 , 40F
資料對數佔 total 35 對的樣本比例是否遠超過 1/6.
05/06 13:08, 40F

05/06 13:12, 4年前 , 41F
Test 2 則取 i→j-1 諸格下方與 i→j-1 諸格上方資料對數相
05/06 13:12, 41F

05/06 13:13, 4年前 , 42F
比較, 如同 McNemar test 以左下比右上.
05/06 13:13, 42F

05/06 13:16, 4年前 , 43F
基於資料偷窺效應, 採 Bonferroni 多重比較的想法, 6 ×6
05/06 13:16, 43F

05/06 13:18, 4年前 , 44F
交叉表有25個自由度, 5%顯著水準要採用 0.2% 的名目水準.
05/06 13:18, 44F

05/06 13:32, 4年前 , 45F
退到最後一步,終究能做個前>後 vs 後>前 的
05/06 13:32, 45F

05/06 13:34, 4年前 , 46F
binomial exact test,這工具就很好找了。
05/06 13:34, 46F

05/06 13:37, 4年前 , 47F
不知道老師覺得這樣做有沒有什麼問題?
05/06 13:37, 47F

05/06 19:06, 4年前 , 48F
就直接二項分配, 排除主對角線(前=後). 當然, 在樣本數足夠
05/06 19:06, 48F

05/06 19:06, 4年前 , 49F
時可用常態近似.
05/06 19:06, 49F

05/06 19:15, 4年前 , 50F
似乎有點問題, 包括前面我提的第2個test. 因為在固定前測值
05/06 19:15, 50F

05/06 19:17, 4年前 , 51F
的條件下, 資料對落於兩邊的條件機率並不相等.
05/06 19:17, 51F

05/06 19:23, 4年前 , 52F
如果前測在各類別的分布是均勻的, 則
05/06 19:23, 52F

05/06 19:25, 4年前 , 53F
P[Xi<Yi|Xi≠Yi] = 1/2, 否則不能保證.
05/06 19:25, 53F

05/06 19:27, 4年前 , 54F
應說: 如果前測在各類別的分布是均勻的, 後測在主對角線外
05/06 19:27, 54F

05/06 19:28, 4年前 , 55F
也是均勻的, 則 P[Xi<Yi|Xi≠Yi] = 1/2.
05/06 19:28, 55F

05/06 19:29, 4年前 , 56F
否則, H0 就直接假設 P[X<Y|X≠Y] = 1/2.
05/06 19:29, 56F

05/06 19:33, 4年前 , 57F
以上, X 指前測, Y 指後測. 加註標 i 代表第 i 對樣本值.
05/06 19:33, 57F

05/06 20:53, 4年前 , 58F
謝謝老師。
05/06 20:53, 58F

05/07 07:03, 4年前 , 59F
受測者是隨機抽取而後接受 前測-介入-後測, 因此
05/07 07:03, 59F

05/07 07:04, 4年前 , 60F
(1) 假設前測結果均勻分布不很合理也沒必要;
05/07 07:04, 60F

05/07 07:07, 4年前 , 61F
(2) H0 直接設定 P[X<Y|X≠Y]=1/2 是可行的.
05/07 07:07, 61F

05/07 07:09, 4年前 , 62F
在此假說下用二項分布或其常態近似計算 p-value 做檢定
05/07 07:09, 62F
文章代碼(AID): #1WaWjEQQ (Statistics)