[問題] 共線性情況下的判定係數有參考性嗎

看板Statistics作者 (14號星期五的傑森)時間3年前 (2020/12/03 12:56), 3年前編輯推噓5(5013)
留言18則, 6人參與, 3年前最新討論串1/1
各位前輩好 小弟這邊有個複迴歸的共線性問題想請教一下 就是我的自變量有兩個,但這兩個自變量本身是高度相關 那在"完全不處理共線性"的情況下 我的第一個問題是 我這樣跑迴歸跑出來的迴歸參數估計值beta,對於我輸入不同的自變量所預測到的依變量Y 這樣情況下的Y,是否適合採納? 第二個問題是 若上述的Y適合採納的情況下,那這條回歸方程式的判定係數R平方,是否還有參考性 以上兩個問題,還麻煩版友們協助 也先謝謝願意耐心看到此段落並了解我問題的版友們 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.23.231 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1606971373.A.765.html

12/03 14:06, 3年前 , 1F
預測值唯有自變數範圍且相關性皆與原始資料相仿才會準
12/03 14:06, 1F

12/03 14:27, 3年前 , 2F
請搜尋張翔老師的共線性診斷影片
12/03 14:27, 2F

12/03 14:28, 3年前 , 3F
自變量有幾個就有幾個迴歸係數
12/03 14:28, 3F

12/03 14:36, 3年前 , 4F
1. 既然x間可替換,yhat值自然會算出同樣的數,所以可以
12/03 14:36, 4F

12/03 14:36, 3年前 , 5F
12/03 14:36, 5F

12/03 14:36, 3年前 , 6F
2. rsquare公式只與y跟yhat有關,與bets無關,所以可用
12/03 14:36, 6F
謝謝樓上諸位的回答 ※ 編輯: jasonhsu14 (220.135.101.201 臺灣), 12/06/2020 10:16:30

12/07 08:32, 3年前 , 7F
借題想問:所謂兩個自變數高度相關,聽起來是其中一個變數
12/07 08:32, 7F

12/07 08:32, 3年前 , 8F
對y的解釋性可以大部分由另一個變數代替(也就是第2個變數對
12/07 08:32, 8F

12/07 08:32, 3年前 , 9F
y的解釋性有限),那這個時候放第2個變數不是增加複雜度嗎?
12/07 08:32, 9F

12/07 08:32, 3年前 , 10F
想問這情況下判斷要不要留第二個變數的準則是什麼呢?
12/07 08:32, 10F

12/08 00:02, 3年前 , 11F
看建模目的而定,沒有標準答案
12/08 00:02, 11F

12/08 15:15, 3年前 , 12F
應該要先確認「可用」的意思是什麼?共線性發生時,X
12/08 15:15, 12F

12/08 15:15, 3年前 , 13F
’X接近nonsingular,因此beta估計量跟yhat的variance
12/08 15:15, 13F

12/08 15:15, 3年前 , 14F
會很大
12/08 15:15, 14F

12/13 10:04, 3年前 , 15F
高度共線性的時候,beta估計的變異很大,但y的變異沒差
12/13 10:04, 15F

12/13 10:06, 3年前 , 16F
所以如果只是預測(y)的話沒問題,但模型(beta)不好解釋
12/13 10:06, 16F

12/13 10:07, 3年前 , 17F
至於要保留哪個變數是模式選擇的問題
12/13 10:07, 17F

12/13 10:08, 3年前 , 18F
有人會選讓Rsquare最低的,也有人取平均直接取代他們
12/13 10:08, 18F
文章代碼(AID): #1Vo6_jTb (Statistics)