[問題] 加入新解釋變數後 原有變數方向改變

看板Statistics作者 (我沒有暱稱)時間11年前 (2012/12/10 06:00), 編輯推噓1(1011)
留言12則, 2人參與, 最新討論串1/1
最近在作有關迴歸分析的練習題 其中有一個問題是 假若一開始有一多元迴歸模型 其中某一解釋變數 A (研究最關心之變數)之係數為正 且非常顯著 如果在此模型原有的架構上 加入一新的解釋變數(B)之後 則A的係數變為負數 請問可能造成此現象的可能原因為何? 煩請高手解惑 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 80.112.141.79

12/10 09:56, , 1F
Simpson's Paradox, 或稱 B 是 A 與反應變數關聯之曲解變數.
12/10 09:56, 1F

12/10 09:58, , 2F
意謂 A 與反應變數(以 Y 表之)本應有負的關聯, 但因 B 與 A
12/10 09:58, 2F

12/10 10:00, , 3F
及與 Y 的關聯方向相同(同為正向或同為負向)而且很強, 以致
12/10 10:00, 3F

12/10 10:01, , 4F
當模型疏於考慮 B 之關聯時, A 透過 B 與 Y 之間接關聯被併
12/10 10:01, 4F

12/10 10:02, , 5F
入 A 與 Y 之直接關聯 (真實關聯), 而掩蓋住本來的負向關聯,
12/10 10:02, 5F

12/10 10:02, , 6F
反而呈現正向.
12/10 10:02, 6F

12/10 10:04, , 7F
統計學界稱之為 Simpson's paradox, 是因控制 B 時呈現的關
12/10 10:04, 7F

12/10 10:05, , 8F
聯方向(正負), 在不控制 B (相當於資料合併) 時關聯方向正負
12/10 10:05, 8F

12/10 10:05, , 9F
反轉.
12/10 10:05, 9F

12/10 10:06, , 10F
社會學研究稱 B 是 "曲解變項", 蓋因資料分析時不控制 B, 使
12/10 10:06, 10F

12/10 10:07, , 11F
得 A 與 Y 的關聯因 B 隱藏之作用而被曲解了.
12/10 10:07, 11F

12/11 23:50, , 12F
共線性?
12/11 23:50, 12F
文章代碼(AID): #1GnGe3mr (Statistics)