[問題] 階層迴歸分析係數不顯著

看板Statistics作者 (hey)時間12年前 (2014/01/31 21:25), 編輯推噓0(0035)
留言35則, 2人參與, 最新討論串1/1
最近在分析資料時遇到一個狀況,想請教各位該怎麼解釋/調整分析方式。 我的研究中是使用多元迴歸分析,而預測變項是分成兩個區塊投入。 分析結果,兩個模式的整體解釋力都有達到顯著, 模式一和模式二的 R平方 分別為.28和.43,R平方改變量達到顯著。 但是,在模式二中,所有變項係數都未顯著。(變項間沒有共線性的問題,vif=1-2) 未標準化係數 模式 B 估計值 標準誤差 標準化係數 t P ------------------------------------------------------------- 1 (常數) 1.736 1.188 1.461 .148 A .547 .245 .230 2.238 .028 B .727 .256 .303 2.837 .006 C .218 .101 .232 2.149 .035 ------------------------------------------------------------- 2 (常數) -3.162 1.971 -1.604 .113 A .405 .240 .170 1.688 .096 B .477 .262 .199 1.816 .074 C .104 .106 .111 .980 .331 D .228 .124 .224 1.839 .070 E .200 .123 .196 1.634 .107 對於這樣的結果該怎麼解釋呢? 我目前是以模式一進行解釋,但總覺得怪怪的(畢竟模式二的解釋力較大)。 ps.我也試著在預測變項中只投入ABCD或ABCE, 兩個模式都有顯著(一個是C、D變項顯著,一個是A、C、E顯著)。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 1.170.126.113

02/01 12:53, , 1F
能否提供一下變項的平均數.標準差
02/01 12:53, 1F

02/01 12:53, , 2F
我想問題應該在那....
02/01 12:53, 2F
謝謝提問,平均數標準差如下: A 2.63 ± 2.48 B 3.16 ± 2.46 C 6.97 ± 6.28 D 18.52 ± 5.79 E 13.13 ± 5.76 依變項 7.20 ± 4.21

02/01 18:29, , 3F
如此看來 您的變項是連續型data嗎?
02/01 18:29, 3F

02/01 18:30, , 4F
以這描述性統計量來看 殘差好大...能分析迴歸模型嗎?
02/01 18:30, 4F

02/01 18:33, , 5F
http://ppt.cc/OcNW 這個說明先看看 不是很嚴謹paper
02/01 18:33, 5F

02/01 18:33, , 6F
但有大概的講了一些迴歸分析的觀念
02/01 18:33, 6F
其實嚴格講算是ordinary scale,因為是使用李克特式量表。 殘差的問題,我其實不太確定(不太會看圖)有沒有符合常態分配... http://ppt.cc/O7T7 順帶附上殘差P-P圖及殘差-預測値散布圖 http://ppt.cc/BRDG http://ppt.cc/vuaH

02/02 01:48, , 7F
其實 照圖表看起來 是有點沒有符合迴歸殘差的假定
02/02 01:48, 7F

02/02 01:49, , 8F
但應該不致於反應到迴歸係數上影響這麼多才是
02/02 01:49, 8F

02/02 01:50, , 9F
但我滿好奇 如果是用likert量尺 為何標準差如此大...
02/02 01:50, 9F

02/02 01:51, , 10F
以likert六點量表來說 應該標準差約略為1吧
02/02 01:51, 10F

02/02 01:52, , 11F
所以 你的資料或變項型態是不是要再確認看看?
02/02 01:52, 11F
不好意思,沒說清楚, A、B變項是單題的10點量表,C、D、E都是多題加總之後的分數。 變項是都有正偏態的情形,但應該不影響迴歸的使用?

02/02 15:26, , 12F
Model 2 是 model 1 加上 D, E 兩解釋變數? 我猜這兩解釋變
02/02 15:26, 12F

02/02 15:28, , 13F
數不會與 A, B, C 無關或低度相關. 但顯然這兩變數加入, 至
02/02 15:28, 13F

02/02 15:29, , 14F
少其中之一, 對解釋力的貢獻是可懷疑的. 模型中加入不重要的
02/02 15:29, 14F

02/02 15:30, , 15F
解釋變數, 將使參數估計的誤差擴大, 這是導致在 model 1 顯
02/02 15:30, 15F

02/02 15:31, , 16F
著的 A, B, C 等解釋變數在 model 2 變成不顯著的可能原因.
02/02 15:31, 16F

02/02 15:32, , 17F
看標準化係數看不出什麼, 看原始尺度的迴歸係數及其標準誤,
02/02 15:32, 17F

02/02 15:33, , 18F
比較能看出問題是否如我猜測的.
02/02 15:33, 18F
沒錯,model 2 就是再加上D、E變項。 其實這些變項間都有或多或少相關(如下表) Y A B C D E Y 1 A .289* 1 B .394** .079 1 C .362** .154 .314** 1 D .485** .276* .432** .309** 1 E .429** .127 .257* .479** .480** 1 我目前解釋的方式是比較朝向 「ABC變項就可以很好的解釋Y,增加DE變項無法增加對Y的了解」來解釋。 但又卡在, 當以ABCD或ABCE來預測時, 其實又都可顯著增加解釋力(和只用ABC來預測相比),且D/E變項也有顯著解釋力, 這樣說起來, 好像是因為變項間的相關才導致以ABCDE來預測時,所有變項的效果都不顯著。 只是先前詢問老師, 老師是覺得相關也沒有到極高、VIF也都蠻低的(都不到2),應該不是這個問題。 ps.已補上未標準化的數據,好像也沒有誤差過度膨脹的狀況。

02/02 19:32, , 19F
從未標準化估計值的標準誤來看 我覺得標準誤有點大..
02/02 19:32, 19F

02/02 19:33, , 20F
尤其A.B又是單題10點量表 從M和SD來說 這分布也太...
02/02 19:33, 20F

02/02 19:34, , 21F
單題的10點量表 要視為continuous data跑回歸.....
02/02 19:34, 21F

02/02 19:35, , 22F
我只能說這誤差值沒爆表 已經是不幸中的大幸了...
02/02 19:35, 22F

02/03 17:17, , 23F
本來 model 1 的係數顯著性就不是很高 (t 值不是很大), 加入
02/03 17:17, 23F

02/03 17:18, , 24F
D, E, 雖然 VIF 不是很大, 但係數的標準誤應有明顯提高吧?
02/03 17:18, 24F

02/03 17:19, , 25F
這樣結果變成不顯著, 又有什麼奇怪?
02/03 17:19, 25F

02/03 17:20, , 26F
增加解釋項, 必然提高 R^2, 因此才有 adjusted R^2 的提出,
02/03 17:20, 26F

02/03 17:21, , 27F
希望稍為修正虛假的 R^2 提高現象.
02/03 17:21, 27F

02/03 17:21, , 28F
如果認為 D, E 還是應考慮, 那麼, 試著去掉 D 或去掉 E 看看
02/03 17:21, 28F

02/03 17:22, , 29F
吧.
02/03 17:22, 29F

02/03 17:23, , 30F
回頭看了係數及標準誤, 是係數變小了. 這是因 D, E 變數分掉
02/03 17:23, 30F

02/03 17:24, , 31F
了 A, B, C 的 "效應". 因為這些變數相互間都是正的相關, 所
02/03 17:24, 31F

02/03 17:25, , 32F
以 A, B, C 的係數因 D, E 的加入而變小也是很合理的.
02/03 17:25, 32F

02/03 17:26, , 33F
100元分給5個人跟分給3個人相比, 當然每個人得到的錢變少;
02/03 17:26, 33F

02/03 17:27, , 34F
即使5個人分時總錢數略有增加, 除非增加幅度夠大, 否則每個
02/03 17:27, 34F

02/03 17:28, , 35F
人分得的錢也將變少. 這個例子就像這種情況.
02/03 17:28, 35F
感謝大家的熱心指導、討論! 讓我可以釐清對迴歸的一些觀念,也發現到自己之前忽略了好多該注意的地方。 我比較清楚問題在哪裡了,剛好放完年假可以回學校再努力! 如果大家還有其他想法,或是想提醒後進注意的,也歡迎再提出。 再次感謝大家!新年快樂! ※ 編輯: tonmai 來自: 1.170.11.184 (02/05 17:45)
文章代碼(AID): #1IwwGm1F (Statistics)