Re: [問題] 迴歸的R-square值
※ 引述《chibamo (機掰毛)》之銘言:
: ※ 引述《Natenie (Natenie)》之銘言:
: : 大家好~我想請教一個問題
: : 有關迴歸的R-square(校正後)值 到底重要嗎
: : 我跑了一個model 發現R-square值才0.06左右
: : 有的老師很介意 但又有老師表示R-square值不重要
: : 我很疑惑
: : 謝謝大家~~
: R-square你可以把他想像成correlation coefficient
: 它衡量的是y與你的一堆x之間線性相關的程度
只有簡單迴歸 才會跟x與y的相關程度有關係
: 所以那麼低肯定代表model是有問題的...
沒錯 因為R-square代表了變異被解釋的程度 (總變異被解釋的比例)
變異簡單來說就是不確定的部分 沒有被解釋的部分越多fit的當然越不好
而且只解釋了0.06也太低了.. 我看過的實證論文再怎麼樣低也有做到0.4多 0.5
: 也許關係不是線性,也許是時序資料
是不是線性都無所謂 反正就是變異被解釋的程度
若不是線性就是非線性的model解釋變異的程度 都無所謂
: 你可以試著畫一下scatter plot或用無母數的additive model畫一下圖
可以用model做出來的估計值跟原始值在同一張圖上畫scatter plot
看看估計的結果差異大不大
: R-square不是那麼重要的原因是不同資料或model的值無法互相比較
: 就算有考慮變數個數做adjust之後還是不能比
對同樣的資料是可以比的 就看哪個模型解釋的程度比較好
不過2種指標相比adjust的比較好 因為可以比較自變數的邊際效用
而R-square參數加越多就會越大 所以永遠會選到自變數最多的模型
但是模型還有很多特性要考慮啦 比如說原始資料的自相關性啦等等..
所以要看你focus的點在哪 也不見得是adjust R-square最大的就是最好的model
: 但是不代表值那麼低沒有問題ˋ(′_‵||)ˊ
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.110.193
※ 編輯: lbbear 來自: 140.112.110.193 (01/18 16:46)
※ 編輯: lbbear 來自: 140.112.110.193 (01/18 16:47)
討論串 (同標題文章)