[問題] 增加變數為何可讓原本不顯著的變項變顯著

看板Statistics作者 (LOVE)時間14年前 (2010/03/01 07:32), 編輯推噓5(5016)
留言21則, 5人參與, 5年前最新討論串1/4 (看更多)
我用SPSS跑了複回歸 原本只有年齡、房間數兩個變項時 年齡的斜率是-1.24 (p=0.07) 不顯著 但是後來加入了大小、品質等其他變數後 年齡的斜率變成-1.750 (p<0.001) 變顯著了! 現在老師要我解釋為什麼? 我只知道因為model改變了 所以equation改變了 但我不知道為什麼原本不顯著後來變顯著了?斜率為什麼改了呢? 懇請知道的大大相告 感恩... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 168.122.7.26

03/01 10:59, , 1F
壓迫關係or虛假關係吧!? 共線性造成的結果....
03/01 10:59, 1F

03/01 10:59, , 2F
多元共線性所造成的估算偏誤
03/01 10:59, 2F

03/01 11:07, , 3F
一個一個放進去看看?
03/01 11:07, 3F

03/01 11:08, , 4F
一個一個放 並不能解決問題.....
03/01 11:08, 4F

03/01 12:07, , 5F
那請問怎麼作比較適當呢?
03/01 12:07, 5F

03/01 12:07, , 6F
因為看起來他是後面加了超過一個以上的變數
03/01 12:07, 6F

03/01 12:08, , 7F
請問原po有作過model selection嗎?
03/01 12:08, 7F

03/01 13:38, , 8F
房子年齡 跟房子大小以及品質可能會有關係
03/01 13:38, 8F

03/01 13:38, , 9F
早期的房子 可能都蓋得比較大 因為地比較多 而且便宜
03/01 13:38, 9F

03/01 13:39, , 10F
而 品質也是 比較老的房子 品質可能比較差
03/01 13:39, 10F

03/01 13:41, , 11F
以上只是我個人推測 只是提出一點可能性
03/01 13:41, 11F

03/01 13:45, , 12F
我有用partial F-test去檢測,結果age真的能顯著解釋房價
03/01 13:45, 12F

03/01 13:46, , 13F
可是我還是搞不懂在只放兩個變項時age為何會不顯著?
03/01 13:46, 13F

03/01 13:47, , 14F
這題是要我解釋為何兩個model斜率和p值會不同? @@
03/01 13:47, 14F

03/01 13:59, , 15F
原po要不要先試試 把所有變項求相關 看看相關有多高
03/01 13:59, 15F

03/01 14:00, , 16F
因為 房子年齡跟大小.房間數.品質 本身就可能相關
03/01 14:00, 16F

03/01 14:01, , 17F
當你把全部都當自變項丟進去迴歸模式 會產生共線性
03/01 14:01, 17F

03/01 14:02, , 18F
如果真的是共線性問題 正or負 顯著or不顯著 都不奇怪
03/01 14:02, 18F

03/01 14:04, , 19F
因為在共線性嚴重的迴歸模式中 算的b值和p值都是錯的
03/01 14:04, 19F

03/01 14:24, , 20F
同樓上c大~ 看x之間彼此相關程度
03/01 14:24, 20F

01/02 15:04, 5年前 , 21F
我有用partial http://yofuk.com
01/02 15:04, 21F
文章代碼(AID): #1BYlqOup (Statistics)
討論串 (同標題文章)
文章代碼(AID): #1BYlqOup (Statistics)