Re: [問題] negative R^2
※ 引述《musicmen ()》之銘言:
: ※ 引述《dreamson (做不完的事情)》之銘言:
: : R^2是在算迴歸模型中,自變數對應變數變異的解釋能力
: : 因此你用70% data估計出迴歸參數後,算出來的R^2當然是用原本
: : 70%的data去算出來的,你不能再拿另外30%data帶入去算R^2,那沒有
: : 意義,要有意義的話,就是在用剩下30%的data再去估計出另一條回歸式
: : 跑出來的R^2才是有意義的。
: : 你也可以去看一下R^2的公式,他所帶入的實際資料一定就是估計出參數的那些資料
: : 而不是另外在代資料
: 恩恩..這好像也是我遇到的問題, 我希望這些找出來的參數a0, a1, a2
: 是可以被generalize的, 換句話說我希望以後我測到的任何data的variance
: 至少可以被這些參數解釋一部份, 不過這樣看來的話是不是因為你無法假設
: 原本測量到的data是homogeneous? 還是這的確存在某些定義上的限制嗎?
先說題外話...
一般來說,自變項多用 x1, x2... 表示
自變項的係數多用 b1, b2... 表示
截距的話,有些人用 a 有些人用 b0
但是截距項不會有 x0 出現...
回主題...
你運用一組數據去建構一個迴歸式
R^2 是協助你決定是否接受這個這個模型設定的工具
一旦你接受這個模型了,在你運用這個已被接受的模型去做預測時
R^2 這項工具此時已經不具意義了...
因為你當初已經接受了這個模型的設定以及所估算出來的參數...
一個模型的預測效果好不好,並不是這樣去測的
應該利用一組自變項資料去估算出一組依變項
然後看看這組估算出來的依變項表現如何...
估出來的結果如果不好,那麼這個模型就有討論的空間了...
這時,你可能就得推翻或修改原先的模型
要修還是要翻?就要看研究人員的決定...
--
◢◣﹏﹏ 親山近水 仁智兼備﹒﹒﹒
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.231.225.222
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 4 之 4 篇):