[問題] 檢定殘差不呈常態

看板Statistics作者 (年紀大了就是這樣)時間5月前 (2023/11/18 01:46), 編輯推噓2(2041)
留言43則, 5人參與, 5月前最新討論串1/1
在做正式分析前,我想先檢測資料是否符合迴歸分析的基本假設 如果我判讀沒錯,目前資料符合下面假設 1.自變項與依變項呈線性 2.殘差保持獨立性 3.殘差呈同質性 但是殘差的常態檢定沒有過,呈現顯著 上網找了很久,沒有找到殘差非常態時該如何處理 (已用k-s檢定樣本呈常態分配) 請問有比較建議的處理方式嗎? 或是我在哪可以找到說明or教學? 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.20.146 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1700243165.A.20D.html

11/18 02:26, 5月前 , 1F
好奇問個,有可能殘差獨立卻非常態嗎?
11/18 02:26, 1F

11/18 07:31, 5月前 , 2F
當然可能誤差項非常態。(不是殘差,但誤差項是不可觀測的
11/18 07:31, 2F

11/18 07:33, 5月前 , 3F
只能用觀測到的殘差代替。不過,殘差其實相互有負相關及變
11/18 07:33, 3F

11/18 07:35, 5月前 , 4F
異數不等的問題。)檢定常態性,是把殘差當誤差來看待,用
11/18 07:35, 4F

11/18 07:37, 5月前 , 5F
q-q plot 觀察,或做 W 檢定,或 K-S 檢定。
11/18 07:37, 5F

11/18 07:38, 5月前 , 6F
對於誤差項非常態分布的處理:如果是線性模型(迴歸模型)
11/18 07:38, 6F

11/18 07:40, 5月前 , 7F
如果樣本數相當大,可以引用中央極限定理於迴歸係數的推論,
11/18 07:40, 7F

11/18 07:42, 5月前 , 8F
或者針對其真正的分布導出 MLE 及迴歸係數之推論。迴歸模型
11/18 07:42, 8F

11/18 07:44, 5月前 , 9F
之比較也是迴歸係數推論。廣義線性模型(link=identity)即是
11/18 07:44, 9F

11/18 07:46, 5月前 , 10F
採用的是最大概似估計及概度比檢定。但如果只知非常態而不
11/18 07:46, 10F

11/18 07:48, 5月前 , 11F
知正確分布,又不想用普通最小平方法,那可能需要用非參數
11/18 07:48, 11F

11/18 07:49, 5月前 , 12F
化方法,也就是無母數方法。
11/18 07:49, 12F

11/18 08:50, 5月前 , 13F
除非違反的很誇張,例如skewness kurtosis 差很多或是
11/18 08:50, 13F

11/18 08:50, 5月前 , 14F
不明顯滿足empirical rule,不然通常還好,原因同樓上
11/18 08:50, 14F

11/18 08:50, 5月前 , 15F
大大說的,residual 本身其實變異數就不同質等等
11/18 08:50, 15F

11/18 08:52, 5月前 , 16F
我是建議不要用K-S直接下結論,因為這個檢定其實蠻難
11/18 08:52, 16F

11/18 08:52, 5月前 , 17F
不顯著的,他的要求很嚴格,差一點點就可能會不顯著
11/18 08:52, 17F

11/18 09:48, 5月前 , 18F
感謝2樓大大說明!我知道殘差(亦或誤差)是可能非常態分佈,
11/18 09:48, 18F

11/18 09:48, 5月前 , 19F
但想問的是殘差有可能在「已知獨立」的情況下但卻「非常態
11/18 09:48, 19F

11/18 09:48, 5月前 , 20F
」嗎?(以前都以為只要獨立就一定會是常態分佈…)有點想不
11/18 09:48, 20F

11/18 09:48, 5月前 , 21F
明白,再請大大解惑,謝謝>"<
11/18 09:48, 21F

11/18 10:17, 5月前 , 22F
感謝大大說明,為了這個超級煩惱. 再次感謝
11/18 10:17, 22F

11/18 19:40, 5月前 , 23F
Boxcox transform
11/18 19:40, 23F

11/19 09:33, 5月前 , 24F
比如說 logistic 迴歸,Poisson 迴歸,前者每個觀測值不是
11/19 09:33, 24F

11/19 09:35, 5月前 , 25F
0 就是 1, 後者觀測值是計數資料,與迴歸曲線之間就群體模
11/19 09:35, 25F

11/19 09:36, 5月前 , 26F
型而言有誤差,就樣本值而言有殘差。殘差因為迴歸線就是這
11/19 09:36, 26F

11/19 09:38, 5月前 , 27F
些資料去 fit 的,所以相互有相關;誤差則是觀測值與群體迴
11/19 09:38, 27F

11/19 09:40, 5月前 , 28F
歸函數之間的差,觀測值相互獨立,誤差只是各觀測值減去一
11/19 09:40, 28F

11/19 09:42, 5月前 , 29F
個理論上的期望值,當然還是相互獨立,但這些誤差怎麼可能
11/19 09:42, 29F

11/19 09:43, 5月前 , 30F
常態分布?更別說要假設它們是 i.i.d. 常態。事實上如線性
11/19 09:43, 30F

11/19 09:45, 5月前 , 31F
模型的 "誤差是 i.i.d. 常態" 只是一個分析者設立模型時的
11/19 09:45, 31F

11/19 09:46, 5月前 , 32F
假設,這假設是否為真有時候需要檢驗,這就是殘差分析的項
11/19 09:46, 32F

11/19 09:48, 5月前 , 33F
目之一。殘差是群體模型誤差項的替代或估計,因此從各種殘
11/19 09:48, 33F

11/19 09:50, 5月前 , 34F
差圖可以看出很多東西,如迴歸函數適當否?誤差變四是否為
11/19 09:50, 34F

11/19 09:51, 5月前 , 35F
常數?誤差項是否符合原假設的常態?有沒有離群點?是否有
11/19 09:51, 35F

11/19 09:53, 5月前 , 36F
些影響點需要特別注意。關於誤差常態性的檢查,通常看 qq圖
11/19 09:53, 36F

11/19 09:55, 5月前 , 37F
W 檢定與 qq圖密切關聯,至於 S-K 檢定,其實它比較適合用
11/19 09:55, 37F

11/19 09:56, 5月前 , 38F
在不需估計參數的資料,Box-Cox 轉換雖然可能改善誤差項的
11/19 09:56, 38F

11/19 09:58, 5月前 , 39F
態使其較趨對稱也較接近常態,但也改變了迴歸函數式及相加
11/19 09:58, 39F

11/19 10:01, 5月前 , 40F
性結構,但如果樣本不是太小,殘差顯示誤差項分布不是太偏
11/19 10:01, 40F

11/19 10:02, 5月前 , 41F
則關於迴歸係數的推論,t 程序,F 程序就不用太擔心。
11/19 10:02, 41F

11/19 10:06, 5月前 , 42F
前面 誤差項變異數 打成 誤差變四 .
11/19 10:06, 42F

11/19 11:47, 5月前 , 43F
謝謝yhliu大大!非常清楚!!
11/19 11:47, 43F
文章代碼(AID): #1bLwRT8D (Statistics)