Re: [問題] 請問局部權重回歸的RSS
※ 引述《now401.bbs@ptt.cc (red-dog)》之銘言:
> 不知有沒有人可以幫我解惑 ?
> 最近在用局部全重回歸(Loess)的方法做分析,有一點令我蠻疑惑的,
> 就是我看書上在調整span的部分,當span越小其所使用的參數越多,
> 相對的RSS(residual sum of square)會越小,
> 可是當我用自己的資料下去做分析時,當span越小RSS值結果越大耶 !? (Q1)
> 我去看殘差圖發現span越小圖形中有某幾點的殘差越大,
> 照理說loess不是經由權重就能消除特異值嗎? (Q2)
檢查一下你的 loess 計算程序吧!
當你只考慮小範圍配適直線時, 即使偶而會有某些點殘差
比考慮大範圍來得大, 但那不會是正常趨勢, 而且整體而
言(整組資料配適結果)當然是考慮小範圍的平均(廣義的)
殘差較小. 極端情形例如以兩個點配適直線, 那完全沒有
殘差.
> 我有查到說當span取太大,會讓誤差變大;取太小的話會讓變異數變大
> (不知能否解釋Q1)
> 那如果幫我不小心把span設太小的話,是不是就變成過度配式的問題啊? (Q3)
哪有 "不小心設太小" 的事?
如果你縮小 span 至僅用兩個點做局部直線配適, 使得殘
差完全是 0(除非在同一位置有重複反應觀測值), 能說是
"不小心" 嗎? span 愈小則配適值愈接近觀測值, 也就是
愈可能把誤差當趨勢, 這就是過度配適問題. 另一方面,
span 愈大則趨勢線愈平滑,也就是不重要的趨勢就被當做
誤差處理. span 的選擇是在平滑度與觀測值之間做取捨,
是採用這類方法的一個重要決策問題, 哪能以 "不小心"
來解釋抉擇失當?
> 以及若是從統計角度去看的話,這樣再選取span時要考慮到誤差跟變異數
> ,有什麼比較好的方法能夠決定是要依哪一項為主呢 ?
> 謝謝各位幫我解惑了
對 loess 方法不夠了解時,我絕不會以它為主要方法! 既
要用一種方法, 就該用心去了解!
--
來自統計專業的召喚...
無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區)
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
★本文未經本人同意請勿轉載; 回覆請勿全文引用, 請僅留下直接涉及部分。
--
夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子
之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下
矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以
喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87海
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 2 之 3 篇):