Re: [問題] 回歸問題急問

看板Statistics作者tew (咖啡王子)時間17年前 (2008/12/28 14:26)推噓1(1推 0噓 0→)

留言1則, 1人參與討論串2/2 (看更多)

這邊令我在意的不是方法學而是心態你在心態上已經認定好的迴歸模型就是要建立出變數都顯著的模型因此很在意造成不顯著的變數跟outlier 那麼我這樣說明好了你的模型之所以會顯著其實就是那極端值也是那不顯著的變數造成的為什麼呢因為y=a+bx中 b的意義就是當x變動一單位時，y會隨之變動幾單位但如果x變異不大時，表示X集中於平均數但如果有outlier的產生那變異性就會增加那麼b就會顯著那麼有沒有意義呢? 接下來就是變數請考慮共線性問題以及交互作用放入變數顯著刪去不顯著的變數後不顯著你可以把不顯著的變數當作是化學作用的催化劑有催化劑以後促進化學作用的產生進行化學反應後催化劑不會有任何改變因此催化劑不顯著但是沒有催化劑化學作用一樣會產生只是費時長久所以請思考不顯著的原因而不是刪了就好接下來回答本文建立一個好的模型在於完善的理論基礎與架構然後有多少證據說多少話好的模型不必在於星星的多寡 ※ 引述《coolcarl83t (??????????????????)》之銘言： : 請問在建立回歸模型時,是要先透過STEPWISE等方法把不顯著的變數刪掉 : 把多餘變數刪掉後,在開始刪除資料中的離群值?? : 還是要先透過COOK/DFFITS法先將離群值刪除後 : 再透過STEPWISE等法來把不顯著的變數刪掉以找出最適合的MODEL?? : 今天在跑回歸時,我先透過STEPWISE的方法把不顯著的變數刪掉,結果 : 開始刪離群值後,那些剩下來顯著的變數卻變不顯著了??? : 之後我採用先刪離群值的方法,然後再刪變數,結果在刪完變數後 : 又有過大的離群值要刪了??? : 感覺這兩個都是互相關聯 : 請問各位大大要這兩個的優先順序是如何 : 到底要建立一個好的回歸模型是要先刪離群值或是先刪除多餘的變數?? : 感謝各位大大的回答 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 134.208.29.230

推

angelmoomin

12/28 15:38, , 1^F

12/28 15:38, 1^F

‣ 返回看板[ Statistics ] 統計

‣ 更多 tew 的文章

文章代碼(AID): #19LnmH5B (Statistics)