[問題] ANOVA變異數不同質的處理

看板Statistics作者 (朵兒)時間2年前 (2023/08/28 19:30), 編輯推噓1(1041)
留言42則, 2人參與, 2年前最新討論串1/1
各位版友大家好~ 想請教一個有關ANOVA變異數不同質的處理方式 我有先在網路上檢索,也查閱過相關書籍 相關的處理作法有2種: 一、Brown-Forsythe + Games-Howell事後比較 再跑一次ANOVA,但在SPSS的﹝Options﹞中勾選Brown-Forsythe或Welch統計量, 來檢定平均數(Robust Tests of Equality of Means)。 二者都服從F分配,且不需變異數同質性假設。 當顯著時,再以Games-Howell進行事後比較(Post hoc)。 -->結果:Brown-Forsythe檢定結果為.039達到顯著, 但變異數分析P值未達顯著,奇怪的是,事後檢定也有數個彼組別此間有差異。 二、做資料轉換 書中講的轉換方式是對原始資料開根號 我按照書中轉換完成重新跑出來的分析結果 Levene 統計量為.53未達顯著 -->結果:進一步看ANOVA發現P值是.89未達顯著,事後比較各組別也未達顯著。 #我的疑惑: (一)用兩種方式跑出來的結果不一致,不知道該用哪一種才正確? (二)如果寫第二種資料轉換,我發現它的平均值因為開根號的關係也被開根號了, 我在論文呈現時應該寫開根號後的平均值嗎? (三)第一種方式Brown-Forsythe達到顯著,但變異數分析那個表又未達顯著, 事後檢定又是有好幾組之間有差異,這是正常的嗎?在論文中我又應該如何呈現呢? 以上幾個問題還請版上的前輩及大師們協助解惑了,感謝大家~~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.122.53.37 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1693222215.A.5FC.html

08/29 08:24, 2年前 , 1F
(1) 不一致很正常,但你的結果並未不一致,兩種方法的多群
08/29 08:24, 1F

08/29 08:25, 2年前 , 2F
體平均數間總體檢定都是不顯著,不是嗎?
08/29 08:25, 2F

08/29 08:29, 2年前 , 3F
(2) "事後比較" 是總體平均數間差異顯著時才進一步檢查哪些
08/29 08:29, 3F

08/29 08:31, 2年前 , 4F
平均數之間的差異具顯著性,Games Howell 是變異數不等
08/29 08:31, 4F

08/29 08:32, 2年前 , 5F
時把本來不是 t 分布的兩獨立樣本平均數差之標準化量強
08/29 08:32, 5F

08/29 08:34, 2年前 , 6F
以 t 分布近似,相當於變異數相等時的最小顯著差法,本
08/29 08:34, 6F

08/29 08:35, 2年前 , 7F
質上是忽略多群體間比較的性質,不像 Scheffe 或 Tuky
08/29 08:35, 7F

08/29 08:37, 2年前 , 8F
法本身已考慮到多群體間比較(因此不需總體檢定顯著可用
08/29 08:37, 8F

08/29 08:41, 2年前 , 9F
變數轉換法本質上是假設變異數和平均數是相關的,但如果變
08/29 08:41, 9F

08/29 08:42, 2年前 , 10F
異數之不同並非因平均數之不同,則經變數轉換後可能扭曲
08/29 08:42, 10F

08/29 08:46, 2年前 , 11F
資料。故以你的結果來說,群體間變異數的不同並非因平均
08/29 08:46, 11F

08/29 08:48, 2年前 , 12F
數不同所致,而平均數間差異總體而言並不顯著;若懷疑是
08/29 08:48, 12F

08/29 08:49, 2年前 , 13F
否其實某些群體之間仍是有差異,需考慮類似 Scheffe 或
08/29 08:49, 13F

08/29 08:52, 2年前 , 14F
Tukey 法這類本身就考慮到多群體比較的方法。不過,如
08/29 08:52, 14F

08/29 08:53, 2年前 , 15F
Scheffe 法是把總體比較的平方和集中在成對平均數間比較
08/29 08:53, 15F

08/29 08:55, 2年前 , 16F
上,所以若總體(ANOVA))檢定不顯著,任一對平均數間之
08/29 08:55, 16F

08/29 08:55, 2年前 , 17F
Scheffe 檢定也應不顯著。
08/29 08:55, 17F

08/30 22:49, 2年前 , 18F
藉題請教,當資料非呈常態及不滿足變異數同質性時,可以
08/30 22:49, 18F

08/30 22:49, 2年前 , 19F
改用Kruskal-Wallis或Moods檢定中位數,也看過一個說法是
08/30 22:49, 19F

08/30 22:49, 2年前 , 20F
當資料量足夠時,即使不滿足常態跟變異數同質性,繼續用AN
08/30 22:49, 20F

08/30 22:50, 2年前 , 21F
OVA也仍然有足夠的檢定功效,請教實務上應用的判斷邏輯跟
08/30 22:50, 21F

08/30 22:50, 2年前 , 22F
使用時機?
08/30 22:50, 22F

08/31 08:25, 2年前 , 23F
ANOVA 的平均數間 F 檢定只是兩組平均數間 t 檢定擴充至多
08/31 08:25, 23F

08/31 08:27, 2年前 , 24F
組平均數的結果,記得 t^2 = F, 也就是 t 變量的平方即是分
08/31 08:27, 24F

08/31 08:28, 2年前 , 25F
子自由度是 1 的 F 變量。由於 t 檢定對群體常態性的穩健性
08/31 08:28, 25F

08/31 08:30, 2年前 , 26F
只要群體分布不是乖離常態性太嚴重(如偏態嚴重或峰度太高)
08/31 08:30, 26F

08/31 08:32, 2年前 , 27F
各組樣本不是太小,各組群體變異數相等,t 檢定以及ANOVA
08/31 08:32, 27F

08/31 08:33, 2年前 , 28F
的 F 檢定仍是可用的。至於各群體變異數不等的問題,在 t
08/31 08:33, 28F

08/31 08:35, 2年前 , 29F
檢定是用所謂 Welch t 檢定,實際上也就是分母用正確的樣本
08/31 08:35, 29F

08/31 08:37, 2年前 , 30F
平均數差的標準誤,而自由度就是把樣本平均數差的變異數估
08/31 08:37, 30F

08/31 08:40, 2年前 , 31F
計式近似一個 scaled chi-square; 在 ANOVA 的 F 檢定也有
08/31 08:40, 31F

08/31 08:42, 2年前 , 32F
類似方法,細節我不記得了,不知仍用原來的誤差平方和或有
08/31 08:42, 32F

08/31 08:44, 2年前 , 33F
修改。不管如何,此時處理平方和和誤差平方和都不是卡方變
08/31 08:44, 33F

08/31 08:45, 2年前 , 34F
量,用 Satterthwaite 近似一個 scaled chi-square,而後可
08/31 08:45, 34F

08/31 08:51, 2年前 , 35F
以把ANOVA檢定統計量近似 F 分布。Satterthwaite-Welch 方
08/31 08:51, 35F

08/31 08:52, 2年前 , 36F
法只是一個近似方法,只是被認為 "還不錯", 也可能有其他不
08/31 08:52, 36F

08/31 08:54, 2年前 , 37F
做資料轉換也非 Welch 的方法。不過,在變異數似乎依平均數
08/31 08:54, 37F

08/31 08:56, 2年前 , 38F
而變時採用變異數穩定性轉換,在群體非常態(兼變異數不等)
08/31 08:56, 38F

08/31 08:57, 2年前 , 39F
時採用 Box-Cox 類常態化變換,可能是最常用的方法?至於
08/31 08:57, 39F

08/31 08:59, 2年前 , 40F
改用無母數方法,主耍是適用於非常態群體,至於分散度異質
08/31 08:59, 40F

08/31 09:00, 2年前 , 41F
性問題,在無母數中方法中可能仍然是個問題,使用時仍需看
08/31 09:00, 41F

08/31 09:02, 2年前 , 42F
看該方法有什麼假設條件,你的資料是否符合。
08/31 09:02, 42F
文章代碼(AID): #1ax8L7Ny (Statistics)