[程式] Model is not full rank,線性相依?(SAS)

看板Statistics作者 (1234567)時間8年前 (2015/07/19 09:21), 編輯推噓5(5025)
留言30則, 5人參與, 最新討論串1/1
[軟體程式類別]: SAS [程式問題]: 資料處理ˇ [軟體熟悉度]: 低(1~3個月) [問題敘述]: 跑完回歸後result出現以下這段話 Note: Model is not full rank. Least-squares solutions for the parameters are not unique. Some statistics will be misleading. A reported DF of 0 or B means that the estimate is biased. 我的model是 Y=CEO_Accexp+TOT_Incentive+CEO_Accexp*TOT_Incentive 其中CEO_Accexp為Dummy,非1即0 想請問 1.問題是出在程式還是回歸模型? (我認為有可能是線性相依,但太久沒碰計量了= =) 2.full rank是什麼意思? [程式範例]: proc reg data=CEO_Incentive_1_Y4_RegTable; where accrual_error NE . and CEO_ACCEXP NE . and TOT_Incentive NE . and CEO_ACCEXP_TOT NE .; model accrual_error=CEO_ACCEXP TOT_Incentive CEO_ACCEXP_TOT; test CEO_ACCEXP=0, TOT_Incentive=0, CEO_ACCEXP_TOT=0; quit; ----------------------------------------------------------------------------- 還請高手指教 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.119.143.76 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1437268873.A.1DF.html

07/19 11:52, , 1F
TOT_Incentive的值是什麼 你的三個變數 線性相依
07/19 11:52, 1F

07/19 11:53, , 2F
collinearity, check vif or condition number
07/19 11:53, 2F

07/19 11:55, , 3F
X有共線性 X'X就會less than full rank, OLS就不會是
07/19 11:55, 3F

07/19 11:55, , 4F
唯一
07/19 11:55, 4F

07/19 12:05, , 5F
Inverse 爆掉啦
07/19 12:05, 5F

07/19 15:27, , 6F
Full rank滿秩矩陣
07/19 15:27, 6F

07/19 17:17, , 7F
三個自變數成立線性關係, 導致 X 矩陣不是 full rank 了,
07/19 17:17, 7F

07/19 17:18, , 8F
還看什麼 vif, conditional number?
07/19 17:18, 8F

07/19 22:35, , 9F
有可能只是很嚴重的collinearity 如果是perfect collin
07/19 22:35, 9F

07/19 22:35, , 10F
earity 那就基本違反Gauss Markov assumptions了
07/19 22:35, 10F

07/20 08:30, , 11F
Gauss-Markov assumption 沒有規定 X 矩陣必須是 full rank
07/20 08:30, 11F

07/20 08:31, , 12F
吧? 非 full rank 只是使得迴歸係數不可估, 但 ls estimate
07/20 08:31, 12F

07/20 08:32, , 13F
仍是 BLUE (for E[Y]).
07/20 08:32, 13F

07/20 08:33, , 14F
既然軟體已判斷 X 不是 full rank, 就是 X'X 的 eigen valu
07/20 08:33, 14F

07/20 08:34, , 15F
至少一個已可以說是 0, 還看什麼 vif, conditional number?
07/20 08:34, 15F

07/20 08:35, , 16F
SAS 的 GLM (一般線模) 程序處理的多的是 non full rank 的
07/20 08:35, 16F

07/20 08:37, , 17F
GM有規定no perfect collinearity 這是確保BLUE的其中
07/20 08:37, 17F

07/20 08:37, , 18F
一個假設 原po的問題如果真的是perfect collinearity
07/20 08:37, 18F

07/20 08:37, , 19F
那就沒戲 如果只是強共線 就還有機會找替代的biased es
07/20 08:37, 19F

07/20 08:37, , 20F
timate
07/20 08:37, 20F

07/20 08:37, , 21F
情形, 所以才會有涉及 "可估函數". 如果 X 是 full rank,
07/20 08:37, 21F

07/20 08:38, , 22F
任何模型參數(迴歸係數)的 linear function 包括各係數本身
07/20 08:38, 22F

07/20 08:38, , 23F
都是可估的.
07/20 08:38, 23F

07/20 08:40, , 24F
就算完全共線, 照樣可以找有偏估計. Ridge regression 可沒
07/20 08:40, 24F

07/20 08:41, , 25F
規定完全共線的情形不能用.
07/20 08:41, 25F

07/20 08:56, , 26F
對 但是問題在於 這時候的出發點OLS 本身就不是個好est
07/20 08:56, 26F

07/20 08:56, , 27F
imate (非 如果再ridge下去 只會更遭? 況且ridge本身就
07/20 08:56, 27F

07/20 08:56, , 28F
不是個feasible的方法(以vif的角度來看) 所以perfect c
07/20 08:56, 28F

07/20 08:56, , 29F
ollinearity情況下 還是用pca regression等方法會好一
07/20 08:56, 29F

07/20 08:56, , 30F
07/20 08:56, 30F
文章代碼(AID): #1Lglk97V (Statistics)