[問題] 請問chi-square的假設

看板Statistics作者 (marki)時間4年前 (2021/06/22 12:59), 4年前編輯推噓0(0012)
留言12則, 3人參與, 4年前最新討論串1/1
各位前輩好 假設小弟有一個dataset, 總共有120個病人 其中有80個病人得了A病,60個病人得了B病。也就是說有部分的人同時有A病和B病 所以Dataset會長得像這樣 病人編號 A病 B病 高血壓 糖尿病 1 1 0 1 0 2 1 1 1 1 3 1 0 0 1 4 0 1 0 0 5 0 0 1 1 都是binary data 我想要看得A病和得B病的高血壓有沒有差異,請問 1) 我可以利用下面的表計算chi-square嗎? A病病患 B病病患 高血壓 + 20 15 高血壓 - 60 45 這個問題是在於因為chi-square可以檢定獨立性。可是我不確定如果兩組病患之間 已經有部分是重複的,可是chi-square做起來顯著,那我可以下結論說"A病和B病得 高血壓的比例是不同的"嗎?這樣有違反任何chi-square的假設嗎? 2) 承上,如果不行的話,有建議可以做甚麼其他的檢定嗎? 3) 承上,如果我有A, B, C三個病,所以除了檢定三個病中高血壓的比例外還需要做 post-hoc,那應該怎麼做呢? 以上 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.253.195 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1624337943.A.C8E.html ※ 編輯: marki (140.116.253.195 臺灣), 06/22/2021 12:59:31

06/22 14:36, 4年前 , 1F
快速的辦法:分成 A+B- A-B+ A+B+ 三類病人。
06/22 14:36, 1F

06/22 14:39, 4年前 , 2F
之後進行兩兩群病人間的2*2卡方並校正p值,就是多重比較
06/22 14:39, 2F

06/22 14:42, 4年前 , 3F
題外話,如果同母體也能抽到 A-B- 樣本,會更理想。
06/22 14:42, 3F

06/22 21:29, 4年前 , 4F
謝謝andrew大大 這關係下一個表格的變數跑出來會不顯著orz
06/22 21:29, 4F

06/23 10:17, 4年前 , 5F
卡方檢定是常態近似檢定, 這例人數會不會太少?
06/23 10:17, 5F

06/23 10:19, 4年前 , 6F
如果不擔心常態近似的誤差, 依 1F 所述分3組, 當作3個獨立
06/23 10:19, 6F

06/23 10:22, 4年前 , 7F
樣本: A+B+,A+B-,A-B+, 實隙上要比較的是 A+ = A+B+∪A+B-
06/23 10:22, 7F

06/23 10:24, 4年前 , 8F
與 B+ = A-B+∪A+B+ 之高血壓比例, 適用不完全成對之相依樣
06/23 10:24, 8F

06/23 10:26, 4年前 , 9F
本的平均數差異檢定(比例也是算術平均數). 即
06/23 10:26, 9F

06/23 10:28, 4年前 , 10F
z = (Xbar-Ybar)/√(Var(Xbar)+Var(Ybar)-2Cov(Xbar,Ybar))
06/23 10:28, 10F

06/23 17:35, 4年前 , 11F
這樣本數用老師的z值可能不行。3x2交叉表用exact或per
06/23 17:35, 11F

06/23 17:35, 4年前 , 12F
mutation法若沒顯著大概就結束了。
06/23 17:35, 12F
文章代碼(AID): #1WqMuNoE (Statistics)