Re: [問題] 有關GEE結果的判讀

看板Statistics作者 (marki)時間12年前 (2013/09/07 22:26), 編輯推噓4(4011)
留言15則, 3人參與, 最新討論串3/4 (看更多)
※ 引述《ching0629 (Syameroke)》之銘言: : ※ 引述《marki (marki)》之銘言: : : 各位大大好 : : 小弟有一個關於GEE的問題想請教各位大大 : : 我有一個data base 是一群慢性腎疾病病人追蹤16年的數據 : : 每個病人都是一年追蹤一次 : : 記錄的數據是每一年每個病人的年紀、收縮壓、舒張壓、血色素、尿酸、慢性腎疾病分期 : : 等等的實驗數據 : : 所以算是重複測量 : : 小弟想要探討的問題是 : : 不同的併發症(例如貧血)在不同的慢性腎疾病分期 (CKD stage)比例是否有不同 : : ps. 所以有沒有貧血 應該是類別變項 : : 跑出來的結果是 : : 變項 B SE p OR OR 95%CI : : Lower Upper : : Year -0.146 0.038 0.000 0.864 0.802 0.931 : : CKDstage 5 2.186 0.646 0.001 8.900 2.507 31.598 : : CKDstage 4 2.592 0.624 0.000 13.363 3.930 45.435 : : CKDstage 3 0.527 0.299 0.078 1.694 0.942 3.046 : : CKDstage 2 -0.248 0.236 0.293 0.781 0.492 1.239 : : CKDstage 1 ─ ─ ─ ─ ─ ─ : : Year*CKDstage 5 0.119 0.091 0.194 1.126 0.941 1.347 : : Year*CKDstage 4 0.009 0.089 0.920 1.009 0.848 1.201 : : Year*CKDstage 3 0.163 0.058 0.005 1.177 1.051 1.319 : : Year*CKDstage 2 0.111 0.048 0.021 1.118 1.017 1.229 : : Year*CKDstage 1 ─ ─ ─ ─ ─ ─ : : 我想問的事情是 : : 1. 所以根據這樣的分析,我得到的結論是 : : 「貧血在CKD stage stage4比CKD stage1容易發生」嗎? : : 2. 如果上面的答案是肯定的話,那請問用GEE跑出來的結果和我用每個病人第一次的 : : CKD stage與「有/無貧血」跑qui-square跑出來意義有什麼不一樣? : 就回答這兩個問題: : 1. 不算對也不完全錯,因為我猜你只有看下列這列: : CKDstage 4 2.592 0.624 0.000 13.363 3.930 45.435 : 他告訴你的意思是,當year=0時(也就是baseline),第4期的比第1期的貧血比率高 : 而隨著時間推移,這個OR值將會越來越小,因為0.009+(-0.146)<0 : Year -0.146 0.038 0.000 0.864 0.802 0.931 : Year*CKDstage 4 0.009 0.089 0.920 1.009 0.848 1.201 : 按照這個模型,只要追蹤時間達到19年,那第一期的貧血比率就會高於第四期,不過你的推論 : 範圍可能只有到16年,所以應該還好,但最後幾年檢定絕對是不會顯著的 : 2. 這個答案要看你的資料來決定如何回答 : 我先假設你在model中用的CKD Stage是指"baseline"的Stage,那這樣的話最有可能是你的 : "chi-square"檢定整體而言無差異,但其實內部有幾格是有差異的 : 如果你的model中使用的CKD Stage會隨著時間變換,那就有點麻煩了,因為這個model也許做 : 了許多過多不太合理的假設(就我所知CKD患者會不可逆的往ESRD走,若貧血也是不可回覆的 : ,那這個model提供的數字其實合理性不夠),這可能要拿到原始資料才能回答你 謝謝大大們的回覆 我先回答一些問題 從文獻來看CKD應該在stage 3之前都還是有機會是可逆的 從raw data來看,我們的data在stage 4都還有機會回來 貧血也是可逆的(因為之後還會有很多藥物的介入) 所以這個模型好像合理 大大提到的EPO介入的時間點當然也是有可能的解釋 另外,我想再請教一些問題 1. 所以,這裡的CKD stage是第一年的狀況嗎。意思是說這個結果應該會跟第一年的 資料中各個 CKD stage 和 CKD stage1 兩兩跑檢定結果應該會類似嗎? 還是他代表的是16年來的所有data的結果。所以有可能跑出 「CKD stage2反而較CKD stage1有比較少complication的結果」呢 (我的意思是有可能因為有治療的介入,所以CKD stage後期的反而會比CKD stage1 的好) 是哪一個呢? 2. 關於CKD stage* year想請各位大大在看一下另一個表格 Hb 變項 B SE 95%CI p Lower Upper Year 0.115 0.026 0.064 0.165 0.000 CKDstage CKDstage 5 -4.052 0.481 -4.995 -3.110 0.000 CKDstage 4 -1.976 0.438 -2.833 -1.118 0.000 CKDstage 3 -0.742 0.260 -1.252 -0.232 0.004 CKDstage 2 0.114 0.180 -0.239 0.467 0.527 CKDstage 1 ─ ─ ─ ─ ─ Year*CKDstage 5 0.037 0.069 -0.099 0.173 0.596 Year*CKDstage 4 -0.036 0.068 -0.170 0.098 0.600 Year*CKDstage 3 -0.055 0.048 -0.149 0.038 0.007 Year*CKDstage 2 -0.044 0.033 -0.109 0.021 0.184   Year*CKDstage 1 ─ ─ ─ ─ ─ 統計公司當時為我們解釋為 「CKD stage3的族群中每追蹤一年,Hb會減少0.055」 (Year*CKDstage 3 -0.055 0.048 -0.149 0.038 0.007) 所以我一直以為這個表格中的 Year 0.115 0.026 0.064 0.165 0.000 這一行,意思是「對所有族群而言,每過一年,血色素會增加0.115」 所以從來沒想過可以把這兩個數據加起來 所以想問的是 是要把B值加起來看嗎?為什麼呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 1.175.112.218

09/08 00:13, , 1F
很想噓統計公司...他的解釋是錯誤的
09/08 00:13, 1F

09/08 00:13, , 2F
那一行正確的解釋是"相較於CKDstage1而言,CKDstage3每年
09/08 00:13, 2F

09/08 00:14, , 3F
多下降0.055,而Stage1每隔一年Hb會上升0.115,所以Stage3
09/08 00:14, 3F

09/08 00:15, , 4F
每年還是上升的
09/08 00:15, 4F

09/08 00:18, , 5F
另外關於第一個問題,是"第0年",我不清楚你的資料如何編
09/08 00:18, 5F

09/08 00:19, , 6F
排Year這個變項,也許你的資料裡是從1開始,但MODEL中的意
09/08 00:19, 6F

09/08 00:19, , 7F
思是他再預測第0年時的狀況
09/08 00:19, 7F

09/08 00:33, , 8F
對了,我問想你!你分析的資料中用的CKDstage是不是會隨
09/08 00:33, 8F

09/08 00:33, , 9F
時間而改變,而不是用baseline的CKDstage
09/08 00:33, 9F

09/08 00:38, , 10F
其實我認為醫學領域的依變項有很長的延遲效應,完全不處
09/08 00:38, 10F

09/08 00:38, , 11F
理就直接放入model可能要做出非常不合理的假設
09/08 00:38, 11F

09/08 04:10, , 12F
我的資料CKD stage每年都會不同
09/08 04:10, 12F

09/08 05:53, , 13F
那這樣的話第一個問題還是Year 0 的data嗎
09/08 05:53, 13F

09/08 16:18, , 14F
當然還是一樣
09/08 16:18, 14F

09/08 17:22, , 15F
這是什麼奇怪的統計公司..
09/08 17:22, 15F
文章代碼(AID): #1IApTzps (Statistics)
文章代碼(AID): #1IApTzps (Statistics)