[問題] 兩變項間高度相關問題

看板Statistics作者 (fingerstyle)時間13年前 (2013/01/29 20:48), 編輯推噓0(0012)
留言12則, 2人參與, 最新討論串1/1
請問一下 我有兩個想看的自變項 但這兩個自變項本身高度相關 結果一放進去 另一個變成負相關 跑logistic regression後 明明在單變相分析中較odd ratio較高的 竟然全都變較低 很有可能是因為共線性造成的 但是最麻的是 其中一個是我想看的主要變項 另一個是在我們領域不得不校正的"年齡" 所以都不可以捨去 在這樣的情況下有辦法解決嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.1.187

01/30 11:35, , 1F
給你個建議,首先把你的變項給類別化
01/30 11:35, 1F

01/30 11:36, , 2F
然後先用年齡做分層,看一下在每個年齡層內妳主要的自變
01/30 11:36, 2F

01/30 11:36, , 3F
項是否還是像你想的那樣很重要,說不定根本就不顯著了
01/30 11:36, 3F

01/30 11:37, , 4F
如果在分層之後,每個迴歸中的自變項全都不顯著了,代表你
01/30 11:37, 4F

01/30 11:37, , 5F
最想看的自變項也許根本就與依變項無關
01/30 11:37, 5F

01/30 11:38, , 6F
這樣你的結果根本不是共線性的問題,而只是你看到了假相
01/30 11:38, 6F

01/30 11:38, , 7F
01/30 11:38, 7F

01/30 11:38, , 8F
最後,在經過一些確認之後,如果你想避免共線性,最好的方
01/30 11:38, 8F

01/30 11:38, , 9F
法就是類別化,至於類別如何切,這就看資料以及是否存在
01/30 11:38, 9F

01/30 11:39, , 10F
有意義的切點
01/30 11:39, 10F

01/30 11:39, , 11F
對了,如果類別化了還有共線性,就試試看配對年齡吧
01/30 11:39, 11F

01/30 17:09, , 12F
感謝 我試試看!
01/30 17:09, 12F
文章代碼(AID): #1H1yKZow (Statistics)