Re: [問題] 增加變數為何可讓原本不顯著的變項變顯著

看板Statistics作者 (johnson)時間16年前 (2010/03/02 01:45), 編輯推噓0(001)
留言1則, 1人參與, 最新討論串3/4 (看更多)
雖然只有幾行 不過我覺得用回文的方式比較清楚XD 跟大家一樣 其實我第一時間想到的問題就是 共線性... ※ 引述《fayaly (LOVE)》之銘言: : 我補充一下 房間數也很奇怪 你是跑複迴歸的吧! 所以你的資料全部都是連續型變數囉! 那你覺得房間數真的可以視作連續變數嗎? : 在只有年齡、房間數兩個變項時 : slope= 20.32 p= 0.0157 response是房價 slope是年齡的係數對吧? 那只放 房價=a1+b1*年齡 這個模型的b1的估計值是多少? R^2是多少? 房價=a2+b2*房間數 b2 ? R^2 ? : 但是後來加入了大小、品質等其他變數後 同樣的 這些變數可以當作連續嗎? : slope= -6.776 p= 0.285 : 斜率從正的變負的 也從顯著變不顯著了!! : 為什麼斜率會改變這麼多呢? : 這題就是要我們回答"為什麼這兩個變數在加入其他變數後斜率會改變?" 1. 你的資料不符合你的統計方法 (就算是連續型變數 還要檢查模型假設對不對!) 建議解法: 把資料做轉換 or 換方法 2. 共線性 (把correlation matrix跑出來看一下就大概知道了...) 建議解法: 選模 : 好難喔! : ※ 引述《fayaly (LOVE)》之銘言: : 我用SPSS跑了複回歸 : 原本只有年齡、房間數兩個變項時 : 年齡的斜率是-1.24 (p=0.07) 不顯著 : 但是後來加入了大小、品質等其他變數後 : 年齡的斜率變成-1.750 (p<0.001) 變顯著了! 為什麼 兩篇文章的output會不一樣.......... : 現在老師要我解釋為什麼? : 我只知道因為model改變了 所以equation改變了 : 但我不知道為什麼原本不顯著後來變顯著了?斜率為什麼改了呢? : 懇請知道的大大相告 感恩... -- 在理性的世界裡,這一切都源自於統計 http://thinkland.twbbs.org -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.169.76.54

03/02 03:00, , 1F
btw 原原po有用到虛擬變數嗎?
03/02 03:00, 1F
文章代碼(AID): #1BY_qWgB (Statistics)
討論串 (同標題文章)
文章代碼(AID): #1BY_qWgB (Statistics)