[問題] Logistic迴歸--當信賴區間與p值矛盾時??

看板Statistics作者 (@@)時間14年前 (2011/12/28 01:26), 編輯推噓9(9046)
留言55則, 9人參與, 最新討論串1/2 (看更多)
各位好: 最近我的研究遇到一個很詭異的問題, 首先我分析的資料樣本數高達兩千多萬... 做logistic regression只有一個應變數(二分變數)和五個自變數(連續/類別等)。 使用SAS 9.2進行運算後發現, 有些變數odds ratio的95%信賴區間包含1,但是p<0.05(實際上在我的案例中p<0.0001)。 或者是p>0.05但是95%CI不包含1。 (p-value以Analysis of Maximum Likelihood Estimates報表中的 Wald chi-square Pr>ChiSq為主。) 我諮詢過兩位教生統的老師, 其中一位說一定是我資料key-in錯誤,因為這不可能發生...@@" 另一位說,他聽說過有這種情況,但是自己從來沒遇到過, 也不曉得要如何解釋數據... 請問各位,遇到這種情況時該以p-value為判定顯著與否的標準, 還是以CI為主?或者這樣的數據毫無意義? 或者...是我SAS的程式寫錯了???= =" 懇請賜教,謝謝!!^^ ps. (到了要上台報告的前天才發現這問題... 害得我辛苦了兩週的logistic regression model 都作廢不能拿來報告了T^T) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.117.192.49

12/28 01:35, , 1F
恭喜你 我不久前也發現過這個問題 請看
12/28 01:35, 1F

12/28 01:36, , 2F
#1EdK6TR4 這篇文章 或是搜尋我的ID
12/28 01:36, 2F

12/28 08:33, , 3F
信賴區間與假說檢定不配套時可能產生不一致結論, 就像對同一
12/28 08:33, 3F

12/28 08:34, , 4F
假說採用兩種不同檢定程序可能結論不一致. 例如普通列聯表卡
12/28 08:34, 4F

12/28 08:35, , 5F
方檢定, 採用 Pearson chi-squared 與 LR G-squared 可能結
12/28 08:35, 5F

12/28 08:37, , 6F
論不同. 而在本例樣本數極大, p-value 除了做為統計顯著性判
12/28 08:37, 6F

12/28 08:38, , 7F
別(顯著/不顯著)以外, 無任何參考價值. 倒是信賴區間比較能
12/28 08:38, 7F

12/28 08:39, , 8F
顯示實質顯著性. 既然 OR 的 C.I. 包含 1, 顯示關聯性可認為
12/28 08:39, 8F

12/28 08:40, , 9F
不存在. 事實上只要 C.I. 接近 1 而不一定包含 1, 就可說不
12/28 08:40, 9F

12/28 08:40, , 10F
具實質顯著性.
12/28 08:40, 10F

12/28 08:41, , 11F
當然以上是假設資料及計算都沒問題.
12/28 08:41, 11F

12/28 08:42, , 12F
再者, 會有這樣的現象, 在本例大樣本情況, 很可能是 0-1 比
12/28 08:42, 12F

12/28 08:44, , 13F
例太懸殊, 以致中央極限定理適用性有點問題.(卡方及 OR C.I.
12/28 08:44, 13F

12/28 08:45, , 14F
之分析程序,都是建立在大樣本理論,也就是套用 CLT 的結果.)
12/28 08:45, 14F

12/28 08:47, , 15F
簡言之: p-value 小而 C.I. 顯示無關聯性, 或 p-value 大,
12/28 08:47, 15F

12/28 08:48, , 16F
都可視為無關聯, 至少是無顯著關聯.
12/28 08:48, 16F

12/28 08:48, , 17F
我猜是你的class是用內設的effect coding 參考組是設為-1
12/28 08:48, 17F

12/28 08:49, , 18F
修正: 會有 CLT 不適用, 一是二元反應之 0-1 比例太懸殊,
12/28 08:49, 18F

12/28 08:49, , 19F
二是解釋變數為類別而某一類樣本數太少.
12/28 08:49, 19F

12/28 08:49, , 20F
參數在估計就是用effect coding 但是程式在計算OR時
12/28 08:49, 20F

12/28 08:50, , 21F
是用dummy coding 也就是參考組設為0 所以有時會產生
12/28 08:50, 21F

12/28 08:53, , 22F
OR信賴區間顯著 參數p-value卻不顯著的情形
12/28 08:53, 22F

12/28 08:55, , 23F
所以 class那邊修改成 class var1 var2..../param=ref;
12/28 08:55, 23F

12/28 09:10, , 24F
先把應變數的敘述統計資料秀出來
12/28 09:10, 24F

12/28 09:23, , 25F
如果如 imaltar 所說的, p-value 是對整個變數的檢定, 而 OR
12/28 09:23, 25F

12/28 09:24, , 26F
的區間估計是對多分類變數單一類別係數之推論, 則二者雖有關
12/28 09:24, 26F

12/28 09:25, , 27F
聯但不在前述我所論的範圍. 此種情形亦非 dummy coding 或
12/28 09:25, 27F

12/28 09:26, , 28F
effect coding 的問題. 而若 p-value 與 C.I. 都是針對單一
12/28 09:26, 28F

12/28 09:27, , 29F
類別,但比較基礎不一(這應是 imaltar 所論本意),則更不足論.
12/28 09:27, 29F

12/28 09:29, , 30F
所以,問者應把問題敘述清楚,否則答者只是白費力氣!
12/28 09:29, 30F

12/28 11:04, , 31F
我是單純針對原PO code方面 到是沒像y大從理論去解釋
12/28 11:04, 31F

12/28 17:08, , 32F
謝謝各位熱心回答!! 我的程式碼的確沒有/param=ref
12/28 17:08, 32F

12/28 17:08, , 33F
現在補上了,正在執行程式當中...= ="
12/28 17:08, 33F

12/28 17:10, , 34F
這個資料庫的應變數1,0比例懸殊,大約是1:10000
12/28 17:10, 34F

12/28 17:11, , 35F
所以也不能排除yhliu所說的比例差太多的可能性。
12/28 17:11, 35F

12/28 18:08, , 36F
1:10000 有點大XD
12/28 18:08, 36F

12/28 18:46, , 37F
1:10000 XD
12/28 18:46, 37F

12/28 22:40, , 38F
剛才跑完之後CI還是一樣,p value終於"正常"了 ^^"
12/28 22:40, 38F

12/28 22:40, , 39F
這樣我的報告終於交的出去了(好擔心干擾作用探討要重寫
12/28 22:40, 39F

12/28 22:41, , 40F
這是罕見疾病的研究,所以1:10000還不算最誇張的XD
12/28 22:41, 40F

12/28 22:42, , 41F
謝謝各位!!^^
12/28 22:42, 41F

12/28 23:03, , 42F
對照組太大的話 可以考慮用配對
12/28 23:03, 42F

12/29 12:19, , 43F
配對是為了縮小需要蒐集資料的樣本. 資料已在那裡, 棄而不用
12/29 12:19, 43F

12/29 12:19, , 44F
而強行 "配對", 似乎沒必要.
12/29 12:19, 44F

12/29 13:42, , 45F
同意y大,不過有時候配對也有好處,比如說如果是依年齡配對
12/29 13:42, 45F

12/29 13:44, , 46F
(假設年齡有影響但並不是有興趣的變數),
12/29 13:44, 46F

12/29 13:46, , 47F
那麼就不必model age effect,可以減少model misspecification
12/29 13:46, 47F

12/29 13:47, , 48F
可能帶來的問題,也就是說犧牲efficiency(丟data),但是可以換
12/29 13:47, 48F

12/29 13:48, , 49F
來robustness of inferential results.
12/29 13:48, 49F

12/29 13:52, , 50F
做研究設計時這些trade-offs要好好考慮
12/29 13:52, 50F

12/29 13:53, , 51F
題外話,在台灣能拿健保資料來做研究真是奢侈的幸福啊
12/29 13:53, 51F

12/29 19:46, , 52F
之前北醫有一個教授 光用健保資料庫就發了一百多篇PAPER
12/29 19:46, 52F

12/29 19:52, , 53F
樓上說的士林恆慶老師
12/29 19:52, 53F

12/29 21:25, , 54F
Google: zero-inflated logistic regression
12/29 21:25, 54F

12/30 21:12, , 55F
很有趣且罕見的狀況。Y
12/30 21:12, 55F
文章代碼(AID): #1E-V_PZq (Statistics)
文章代碼(AID): #1E-V_PZq (Statistics)