Re: [問題] 請問局部權重回歸的RSS
: > 照理說loess不是經由權重就能消除特異值嗎? (Q2)
: 檢查一下你的 loess 計算程序吧!
: 當你只考慮小範圍配適直線時, 即使偶而會有某些點殘差
: 比考慮大範圍來得大, 但那不會是正常趨勢, 而且整體而
: 言(整組資料配適結果)當然是考慮小範圍的平均(廣義的)
: 殘差較小. 極端情形例如以兩個點配適直線, 那完全沒有
: 殘差.
我有去檢查我的計算程序,確定我的運算是正確的
目前我在是推測殘差值的產生可能是因為
當被化分為同一群的x變數可是有幾個對應的y值差異很大
所以可能當span=1時其配適結果算不錯,但當span變小的話
改變的配適的結構,所以導致殘差變大,
這些是我在猜的部分,目前還在做資料的確認...
: > 我有查到說當span取太大,會讓誤差變大;取太小的話會讓變異數變大
: > (不知能否解釋Q1)
: > 那如果幫我不小心把span設太小的話,是不是就變成過度配式的問題啊? (Q3)
: 哪有 "不小心設太小" 的事?
: 如果你縮小 span 至僅用兩個點做局部直線配適, 使得殘
: 差完全是 0(除非在同一位置有重複反應觀測值), 能說是
: "不小心" 嗎? span 愈小則配適值愈接近觀測值, 也就是
: 愈可能把誤差當趨勢, 這就是過度配適問題. 另一方面,
: span 愈大則趨勢線愈平滑,也就是不重要的趨勢就被當做
: 誤差處理. span 的選擇是在平滑度與觀測值之間做取捨,
: 是採用這類方法的一個重要決策問題, 哪能以 "不小心"
: 來解釋抉擇失當?
痾...我這邊所指的不小心是指在選模過程中的調整span值的階段
不好意思用錯文字敘述造成版友的誤解
: > 以及若是從統計角度去看的話,這樣再選取span時要考慮到誤差跟變異數
: > ,有什麼比較好的方法能夠決定是要依哪一項為主呢 ?
: > 謝謝各位幫我解惑了
: 對 loess 方法不夠了解時,我絕不會以它為主要方法! 既
: 要用一種方法, 就該用心去了解!
我後來決定用誤差來當做我選模的依據,主要是考量我的模式是要用來做預測的
之前決定用這方法來分析時完全沒想到這方法的相關資料不好找
再加上時間有點急迫,所以還對他一知半解的就硬著頭皮上了
才導致現在問題一堆,不過幸好還有板友願意指點我,真是萬分感謝啊~~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.120.190.49
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 3 篇):