[問題] 共變數分析-違反迴歸斜率同質

看板Statistics作者 (撼動宇宙的第一小步)時間12年前 (2013/07/12 04:29), 編輯推噓0(0023)
留言23則, 3人參與, 最新討論串1/1
各位版大好,我又有問題上來請教大家 假如我的研究設計是: 自變項A:國家的經濟能力(分三組,各組有強到弱的次序之分) 依變項B:國家參加環境保護運動的情況(連續變數) 控制變數(共變數)C:加入國際組織的時間(連續變數) 我的研究主題是想知道: 這三個經濟能力不同的組別,在環境保護運動的參與上是否有顯著差異? 經濟情況越好的國家組別,參加次數是否其他組別多? 但在統計時我發現,某些國家因為比較晚建國 所以加入國際組織的時間比較晚,進而讓他們的參加次數不高 而這些國家大多是經濟能力中等或不好的國家 所以如果直接用ANOVA來分析 很容易就會讓"經濟力好"的組別與其他組之間有顯著差異出現 但這種差異很可能是因為"加入國際組織的時間早晚"所造成的 所以我想把變項C(加入的時間先後)給控制住 再去看組別之間有無顯著差異 我本來打算用 單因子共變數分析(ANCOVA) 一開始就先做迴歸斜率同質檢定 但結果出來數值都是顯著的,表示違反迴歸斜率同質 很多統計書籍都說: 只要違反迴歸斜率同質,就不能用ANCOVA 但接下來的作法就有不同意見,讓我無從分辨起要採信哪一個: 1. 有人認為"在單因子共變數分析下,即使違反迴歸係數同質 的假設影響並不大"(朱經明, 2007) 2. 有人認為"可以改作雙因子變異數分析Two-Way ANOVA" 3. 有人認為應採Johnson-Neyman 法來分析 4. 有人認為"不管共變量,而僅僅使用ANOVA (因為研究者所使用的共變量不存在研究設計價值)" http://ppt.cc/VrsX 5. 將數據做轉換,比如平方、對數、倒數 我的疑惑和困難點在於: 1. 我可以不管迴歸斜率的檢定結果,直接作共變數分析嗎? 2. 如果改作雙因子變異數分析(Two-Way ANOVA),這算把C變項給"控制住"嗎? 3. 我有試作雙因子變異數,但結果 自變項A*變項C 交互作用這項有達到顯著 書上是說這時候只要考慮 A*C 交互作用這項就好 但我的研究目的只是想知道:A的三個組別之間有無差異 A*C的交互作用做出來的結果並不是我要的 例如: 我要的結果是:經濟力佳>經濟力差 而雙因子變異數交互作用的結果: 在比較早加入國際組織的組別裡面,經濟力佳>經濟力差 這樣變成我在解釋時還要把"加入時間"這個變項一起說明 如果用共變數分析的話,就可以直接說明"排除變項C後的結果" 那我能否不管A*C這一項,直接看A這一欄去做事後檢定,再報告結果? 4. 我也考慮過用Johnson-Neyman 法來分析 但問題是我找不到軟體去畫迴歸線 而且我看很多用Johnson-Neyman 法的論文 他們都是有分前、後測,但我沒有 而且我的組別有三組,那是不是代表我要畫3條迴歸線? 這樣在解釋時又要把"加入的時間"放在一起解釋 就跟用雙因子變異數時出現一樣的問題: 我只想知道 排除"加入時間"這個變項之後 自變項A的組別之間有無差異 我不想去說明"加入時間"這個變項 5. 我可以按前面有個人說的,直接作ANOVA就好嗎? (因為共變量不存在研究價值?) 6. 資料轉換 這招我也用過了,就是始終違反迴歸斜率同質... 很抱歉,我把問題打得很長 但這樣才能把我的疑問說清楚 煩請有經驗的版友們幫我解答疑惑 感謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 112.105.52.203 ※ 編輯: winchin 來自: 112.105.52.203 (07/12 04:31) ※ 編輯: winchin 來自: 112.105.52.203 (07/12 04:32) ※ 編輯: winchin 來自: 112.105.52.203 (07/12 04:32) ※ 編輯: winchin 來自: 112.105.52.203 (07/12 06:39)

07/12 12:41, , 1F
不一定要用共變異數分析; 當然, 不顧共變數的差異而直接做
07/12 12:41, 1F

07/12 12:42, , 2F
ANOVA 是不可以的. 如果各組的迴歸模型誤差項變異數差不多,
07/12 12:42, 2F

07/12 12:43, , 3F
可以合併用一個複迴歸模型來分析; 否則就每一組一個迴歸模型
07/12 12:43, 3F

07/12 12:44, , 4F
而後再固定 x 而比較各組之 fitted values 吧.
07/12 12:44, 4F

07/12 12:45, , 5F
若合併用一個複迴歸模型, A 建立兩個 dummy variable,
07/12 12:45, 5F

07/12 12:45, , 6F
模型 y = A + B + A*B (這是仿軟體表示法), 即
07/12 12:45, 6F

07/12 12:47, , 7F
y = β0+β1*A1+β2*A2+β3*B+β4*A1*B+β5*A2*B + ε
07/12 12:47, 7F

07/12 12:47, , 8F
哦...漏了 C 變數了!
07/12 12:47, 8F

07/12 12:48, , 9F
若是三組各一個迴歸模型, 比較時設定 B 及 C 之值, 求 y^ 及
07/12 12:48, 9F

07/12 12:50, , 10F
其標準誤, 而後三組間兩兩比較:
07/12 12:50, 10F

07/12 12:51, , 11F
t = (y1^-y2^)/√[(se(y1^))^2+(se(y2^))^2]
07/12 12:51, 11F
感謝您的回應!! 我又發現,原來控制變數C和自變數A之間其實也有相關性 所以用共變數分析好像也沒有啥效用 而那個Johnson-Neyman 法好像也只能用來分析2組的情況 對於3組以上的情形就不適用..= = 嘆 只怪我統計不夠好(在我這領域連共變數分析或ANOVA都很少人用過) 所以您說的用迴歸模型來比較...這對我來說太難了 我只會把共變數丟入自變項控制起來,然後看關聯係數 F值..之類的 但就是不會用多元迴歸模型來比較各組平均數的差異...... 不過總之還是謝謝您^^... ※ 編輯: winchin 來自: 112.105.52.203 (07/14 07:10)

07/15 16:12, , 12F
3組, 類似 ANOVA 的 F 統計量那樣的也不是不行, 只是可能複
07/15 16:12, 12F

07/15 16:13, , 13F
雜些罷了. 上面建議的兩兩比較是較簡單, 易理解的.
07/15 16:13, 13F

07/15 16:14, , 14F
一般在做 ANOVA 或 ANCOVA, 只不過是試圖得到關於 k 組間是
07/15 16:14, 14F

07/15 16:15, , 15F
否存在差異的整體概念罷了, 通常如果 F 檢定顯著, 之後仍然\
07/15 16:15, 15F

07/15 16:16, , 16F
會再做多重比較以確定差異是在哪兩組之間發生的. 那麼, 直
07/15 16:16, 16F

07/15 16:16, , 17F
接做兩兩差異的多重比較而不先透過 F 做整體檢定也未嘗不可,
07/15 16:16, 17F

07/15 16:17, , 18F
只是需要考慮整體型I誤機率之控制罷了, 大不了犧牲點檢定力
07/15 16:17, 18F

07/15 16:18, , 19F
用 α/3 為每個兩兩 t 檢定之顯著水準.
07/15 16:18, 19F

07/15 16:19, , 20F
感謝Y大!!請問Y大可以幫我解答另一個問題嗎?
07/15 16:19, 20F

07/15 16:19, , 21F
我把問題寫在下面那一篇文裡頭
07/15 16:19, 21F

07/15 16:20, , 22F
是關於虛擬變項迴歸分析的 R R^2 F值的問題 感謝!!
07/15 16:20, 22F

07/17 03:05, , 23F
題外話, 你描述問題的文句段落很棒.
07/17 03:05, 23F
文章代碼(AID): #1HtnN6pE (Statistics)