Re: [問題] 迴歸的R-square值

看板Statistics作者 (小熊)時間18年前 (2008/01/18 16:41), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串6/6 (看更多)
※ 引述《chibamo (機掰毛)》之銘言: : ※ 引述《Natenie (Natenie)》之銘言: : : 大家好~我想請教一個問題 : : 有關迴歸的R-square(校正後)值 到底重要嗎 : : 我跑了一個model 發現R-square值才0.06左右 : : 有的老師很介意 但又有老師表示R-square值不重要 : : 我很疑惑 : : 謝謝大家~~ : R-square你可以把他想像成correlation coefficient : 它衡量的是y與你的一堆x之間線性相關的程度 只有簡單迴歸 才會跟x與y的相關程度有關係 : 所以那麼低肯定代表model是有問題的... 沒錯 因為R-square代表了變異被解釋的程度 (總變異被解釋的比例) 變異簡單來說就是不確定的部分 沒有被解釋的部分越多fit的當然越不好 而且只解釋了0.06也太低了.. 我看過的實證論文再怎麼樣低也有做到0.4多 0.5 : 也許關係不是線性,也許是時序資料 是不是線性都無所謂 反正就是變異被解釋的程度 若不是線性就是非線性的model解釋變異的程度 都無所謂 : 你可以試著畫一下scatter plot或用無母數的additive model畫一下圖 可以用model做出來的估計值跟原始值在同一張圖上畫scatter plot 看看估計的結果差異大不大 : R-square不是那麼重要的原因是不同資料或model的值無法互相比較 : 就算有考慮變數個數做adjust之後還是不能比 對同樣的資料是可以比的 就看哪個模型解釋的程度比較好 不過2種指標相比adjust的比較好 因為可以比較自變數的邊際效用 而R-square參數加越多就會越大 所以永遠會選到自變數最多的模型 但是模型還有很多特性要考慮啦 比如說原始資料的自相關性啦等等.. 所以要看你focus的點在哪 也不見得是adjust R-square最大的就是最好的model : 但是不代表值那麼低沒有問題ˋ(′_‵||)ˊ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.110.193 ※ 編輯: lbbear 來自: 140.112.110.193 (01/18 16:46) ※ 編輯: lbbear 來自: 140.112.110.193 (01/18 16:47)
文章代碼(AID): #17a6OqHa (Statistics)
討論串 (同標題文章)
文章代碼(AID): #17a6OqHa (Statistics)