[問題] 階層迴歸beta值與R平方改變量的關係

看板Statistics作者 (>.<)時間17年前 (2009/03/28 13:00), 編輯推噓0(0046)
留言46則, 4人參與, 7年前最新討論串1/2 (看更多)
最近在投稿期刊,審查委員的意見我有點搞不懂,期待有高手可以解釋一下... 我是以階層迴歸來分析, 依變項是照顧者的憂鬱程度 控制變項有 1.病患年齡 2.照顧者年齡 3.病患術後時間 4.疾病嚴重度 預測變項為 1.照顧行為總差異 2.照顧需求總差異 3.照顧關係虛擬變項(k=2) 交互作用 照顧行為總差異*關係 照顧需求總差異*關係 問題來了........ 1.委員質疑,在照顧行為總差異*關係的beta值為.37,但R平方改變量卻只有.03? 老實說我也不知道,這個分析結果(本來就可能)是交互作用不顯著,這樣 的數值是否真的存在很異常的地方? 2.委員質疑自由度有問題,以照顧者憂鬱程度為依變項的自由度為 (7,46), 但依變項改成"病患憂鬱程度"去跑交互作用的階層迴歸,df=(7,47), 他沒說自由度是哪裡有問題(所以是我自己猜自由度是不是應該要一致?) 請問,這樣可能是什麼原因造成的呢? 由於論文是很久以前寫的,現在熊熊要撿回統計概念還挺困難的, 加上修改期限只給我不到一星期,還望有人能回答我的疑問... 感激不盡~ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.174.2.76

03/28 13:18, , 1F
BTW,委員對於我資料調整過後的R平方為負值也提出疑問,
03/28 13:18, 1F

03/28 13:18, , 2F
我查的結果是說,負值可視為0,請問這樣概念對嗎?
03/28 13:18, 2F

03/28 18:42, , 3F
R^2增量偏低, 甚至 adjusted R^2 增量為負, 表示新加入的效
03/28 18:42, 3F

03/28 18:44, , 4F
應可能是不存在的, 其對應的假說檢定結果應該未達顯著界限,
03/28 18:44, 4F

03/28 18:45, , 5F
這與迴歸係數絕對值大小不相干.
03/28 18:45, 5F

03/28 19:41, , 6F
2. Missing data?
03/28 19:41, 6F

03/28 19:51, , 7F
B大是指我的樣本數中有missing data嗎?
03/28 19:51, 7F

03/28 19:54, , 8F
感謝Y大,解釋很清楚,澄清了我模糊的想法 ^^
03/28 19:54, 8F

03/28 20:13, , 9F
Just curious, 你的dependent variable "憂鬱程度"是
03/28 20:13, 9F

03/28 20:14, , 10F
continuous or categorical?
03/28 20:14, 10F

03/28 20:14, , 11F
A negative adj-R^2 suggests that the model does not fit
03/28 20:14, 11F

03/28 20:15, , 12F
the observed data adequately.
03/28 20:15, 12F

03/28 20:22, , 13F
憂鬱程度是連續變項,以憂鬱量表總分高低來表示
03/28 20:22, 13F

03/28 20:23, , 14F
用了高低的說法好像又變成類別變項....其實就是分數而已啦
03/28 20:23, 14F

03/28 20:43, , 15F
I guess for this kind of study it is not surprising to
03/28 20:43, 15F

03/28 20:46, , 16F
see small R^2 and negative adj-R^2 values for several
03/28 20:46, 16F

03/28 20:49, , 17F
reasons: (1) there is a great variability in outcome
03/28 20:49, 17F

03/28 20:49, , 18F
measurement; (2) the investigators did not collect all
03/28 20:49, 18F

03/28 20:51, , 19F
the important predictors.
03/28 20:51, 19F

03/28 22:40, , 20F
如果是整個模型的 R^2 非常低, 甚至 adjusted R^2 負值, 表
03/28 22:40, 20F

03/28 22:41, , 21F
示模型完全沒解釋力, 研究者並未找到真正有解釋力的變數.
03/28 22:41, 21F

03/28 22:42, , 22F
若 unadjusted R^2 不是非常低但 adjusted R^2 為負值, 可能
03/28 22:42, 22F

03/28 22:43, , 23F
是樣本太小, 小得過份, 或模型的解釋變數(效應項)太多.
03/28 22:43, 23F

03/28 22:44, , 24F
至於所列自由度, 我無法理解你指的是甚麼. 若只是變更反應變
03/28 22:44, 24F

03/28 22:46, , 25F
數, 對迴歸平方和的自由度不應有影響, 只會因 missing data
03/28 22:46, 25F

03/28 22:46, , 26F
丟棄部分資料而影響殘差平方和.
03/28 22:46, 26F

03/28 22:48, , 27F
Thanks. 剛要補上(3) sample size is too small.
03/28 22:48, 27F

03/29 21:19, , 28F
ok~多謝兩位精闢的說明 ^^ 我的樣本數是61,
03/29 21:19, 28F

03/29 21:19, , 29F
的確在不同依變項上,有不同的missing data
03/29 21:19, 29F

03/29 21:31, , 30F
看來 sample size 的確小了點
03/29 21:31, 30F

03/29 21:33, , 31F
可以考慮把outcome重新定義成categorical(severe, mild,none)
03/29 21:33, 31F

03/29 21:33, , 32F
重新作categorical data analysis
03/29 21:33, 32F

03/29 21:36, , 33F
好好的觀察一下outcome measure的分布狀況吧
03/29 21:36, 33F

04/01 10:28, , 34F
那麼小的樣本做 CDA? 別忘了通常 CDA 都以大樣本方法分析,
04/01 10:28, 34F

04/01 10:29, , 35F
並且, CDA 並不比迴歸模型效率高!
04/01 10:29, 35F

04/01 19:42, , 36F
y大說的效率是指??
04/01 19:42, 36F

04/01 19:44, , 37F
以這個題材的研究來說,樣本數61是偏小.不過CDA用在這樣的研究
04/01 19:44, 37F

04/01 19:45, , 38F
並不少見,建議做CDA主要是我懷疑dependent var 跟predictor
04/01 19:45, 38F

04/01 19:46, , 39F
之間的關係很難用linear model來解釋,所以建議原作觀察一下
04/01 19:46, 39F

04/01 19:47, , 40F
這些variables的distribution/association/etc
04/01 19:47, 40F

04/01 19:48, , 41F
然後試試CDA.當然,我沒摸過data,也只能純建議
04/01 19:48, 41F

04/01 19:50, , 42F
不過我不是很明白y大所提的"CDA都以大樣本方法分析"的意思
04/01 19:50, 42F

04/01 19:51, , 43F
還有,怎麼比較兩種不同model的效率(efficiency?)?
04/01 19:51, 43F

04/01 19:51, , 44F
可不可以解釋一下?Thanks.
04/01 19:51, 44F

11/09 14:52, , 45F
如果是整個模型的 R^ https://daxiv.com
11/09 14:52, 45F

01/02 14:52, 7年前 , 46F
用了高低的說法好像又變 https://daxiv.com
01/02 14:52, 46F
文章代碼(AID): #19pQxuDr (Statistics)
文章代碼(AID): #19pQxuDr (Statistics)