Re: [問題] 增加變數為何可讓原本不顯著的變項變顯著
雖然只有幾行 不過我覺得用回文的方式比較清楚XD
跟大家一樣 其實我第一時間想到的問題就是 共線性...
※ 引述《fayaly (LOVE)》之銘言:
: 我補充一下 房間數也很奇怪
你是跑複迴歸的吧! 所以你的資料全部都是連續型變數囉!
那你覺得房間數真的可以視作連續變數嗎?
: 在只有年齡、房間數兩個變項時
: slope= 20.32 p= 0.0157
response是房價 slope是年齡的係數對吧?
那只放 房價=a1+b1*年齡 這個模型的b1的估計值是多少? R^2是多少?
房價=a2+b2*房間數 b2 ? R^2 ?
: 但是後來加入了大小、品質等其他變數後
同樣的 這些變數可以當作連續嗎?
: slope= -6.776 p= 0.285
: 斜率從正的變負的 也從顯著變不顯著了!!
: 為什麼斜率會改變這麼多呢?
: 這題就是要我們回答"為什麼這兩個變數在加入其他變數後斜率會改變?"
1. 你的資料不符合你的統計方法 (就算是連續型變數 還要檢查模型假設對不對!)
建議解法: 把資料做轉換 or 換方法
2. 共線性 (把correlation matrix跑出來看一下就大概知道了...)
建議解法: 選模
: 好難喔!
: ※ 引述《fayaly (LOVE)》之銘言:
: 我用SPSS跑了複回歸
: 原本只有年齡、房間數兩個變項時
: 年齡的斜率是-1.24 (p=0.07) 不顯著
: 但是後來加入了大小、品質等其他變數後
: 年齡的斜率變成-1.750 (p<0.001) 變顯著了!
為什麼 兩篇文章的output會不一樣..........
: 現在老師要我解釋為什麼?
: 我只知道因為model改變了 所以equation改變了
: 但我不知道為什麼原本不顯著後來變顯著了?斜率為什麼改了呢?
: 懇請知道的大大相告 感恩...
--
在理性的世界裡,這一切都源自於統計
http://thinkland.twbbs.org
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.169.76.54
→
03/02 03:00, , 1F
03/02 03:00, 1F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 4 篇):