[問題] 散佈圖與迴歸線

看板Statistics作者 (aapaap)時間15年前 (2010/08/08 11:13), 編輯推噓0(0032)
留言32則, 5人參與, 最新討論串1/1
論文上傳在即,但有個地方一直卡住不知如何處理,煩請高手解惑。 我有製作A與B的散佈圖(兩者皆連續變數),A經統計檢測為非常態,所以使 用非母數的方法,以Spearman's rho求相關係數,且求出的相關係數也很低 (係數<0.4),原來我只寫到這裡,圖上也只有座標軸與數據點。 但口委認為散佈圖應標出相關係數與迴歸線,可是我很困惑,據我對統計很 貧弱的知識,可以求迴歸線的前提不是數值資料必須為常態分佈嗎?非常態 的資料如果不想轉換(我有很多數據至今尚未找到轉換成常態的方式),有求 (線性?)關係方程式的方法嗎(非母數的"迴歸"?)? 我跟同學討論過,同學勸我口委要什麼就先給什麼吧,趕快辦離校比較要緊。 我本來也想不管假設檢定就用母數的方法求出Pearson相關係數和迴歸線,卻 發現這樣其實會影響到我原來寫的結果,因為用母數與無母數方法求出的相 關係數數值是不太一樣的,雖然並沒有出現剛好在相關與否臨界值的困擾。 又,如果我仍可以保留原來的非母數分析的結果,在散佈圖上要標註非母數 Spearman's rho的相關係數時,仍是寫"R^2=..."嗎?或者須用其他符號? 很感謝各位的幫忙,如果原有的觀念和想法有誤,也請鞭小力一點,謝謝。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.131.68.223

08/08 11:46, , 1F
求迴歸線應該不須要求資料為常態吧?
08/08 11:46, 1F

08/08 11:48, , 2F
平常做題目時 用最大概似法做點估計或是其他的統計推論
08/08 11:48, 2F

08/08 11:48, , 3F
求迴歸線是需要資料服從常態分配 但不是絕對....
08/08 11:48, 3F

08/08 11:49, , 4F
畢竟迴歸分析 屬於強韌性檢定 違反部分假定還是可以
08/08 11:49, 4F

08/08 11:50, , 5F
是設計好在常態的假設下才能進行的
08/08 11:50, 5F

08/08 11:50, , 6F
但當資料非常態求出迴歸線 必須考慮是否高估or低估
08/08 11:50, 6F

08/08 11:51, , 7F
尤其 相關or迴歸分析 求迴歸線容易受極端值影響
08/08 11:51, 7F

08/08 11:52, , 8F
所以 考量一下 資料非常態 是否存在過多的極端值
08/08 11:52, 8F

08/08 11:53, , 9F
只是 好奇的是 原po樣本數多大? 為什麼資料會非常態
08/08 11:53, 9F

08/08 11:54, , 10F
相關係數有.4 還認為很小 r=.4已經中度相關了.....
08/08 11:54, 10F

08/08 11:55, , 11F
我之前處理過的資料 n約200 r=.2左右就.01顯著了= =
08/08 11:55, 11F

08/08 12:26, , 12F
其實要看領域才知道原PO的相關係數是夠不夠大..
08/08 12:26, 12F

08/08 12:28, , 13F
Pearson 相關係數之分析需要資料服從雙變量常態; 迴歸分析則
08/08 12:28, 13F

08/08 12:29, , 14F
需要誤差項分布為常態, 並不是個別變數資料成常態. 再者,
08/08 12:29, 14F

08/08 12:30, , 15F
若資料數夠多, 即使常態性條件不成立, 迴歸係數之 t 檢定可
08/08 12:30, 15F

08/08 12:30, , 16F
能仍是可用的.
08/08 12:30, 16F

08/08 15:00, , 17F
很感謝各位的熱心回應,雖然我得承認有些部分其實不是很
08/08 15:00, 17F

08/08 15:00, , 18F
瞭解... @@我的研究對象是野生動物,A與B變項分別為個體
08/08 15:00, 18F

08/08 15:01, , 19F
體型大小與體液的生理數值,非常態的情形都發生在樣本數
08/08 15:01, 19F

08/08 15:01, , 20F
大於50(不到80),但樣本數小於20的幾乎都符合常態,
08/08 15:01, 20F

08/08 15:02, , 21F
Spearman's rho的數值範圍為-0.127~-0.237,P>0.05,
08/08 15:02, 21F

08/08 15:02, , 22F
所以才判斷兩變項相關性低。從圖面上看應是有極端值。
08/08 15:02, 22F

08/08 15:20, , 23F
體型大小為常態,對應的體液生理數值為則非常態。
08/08 15:20, 23F

08/08 19:27, , 24F
"樣本數小於20的幾乎都符合常態" 是一個誤解! 只能說 n<20
08/08 19:27, 24F

08/08 19:29, , 25F
時你未能查覺資料不符常態條件. 事實上那麼小的樣本數要確認
08/08 19:29, 25F

08/08 19:29, , 26F
是否不符合常態, 或要評估資料服從甚麼分布, 本就是很難的.
08/08 19:29, 26F

08/08 19:31, , 27F
Spearman 等級相關不顯著與委員要你列出迴歸式是兩回事. 列
08/08 19:31, 27F

08/08 19:32, , 28F
出迴歸式與做迴歸係數等之推論也是兩回事.
08/08 19:32, 28F

08/08 19:32, , 29F
當然如果 Spearman 等級相關的推論能代表兩變數間的關係, 那
08/08 19:32, 29F

08/08 19:34, , 30F
麼迴歸模型很可能也會發現迴歸係數不顯著, 也就是沒有解釋力
08/08 19:34, 30F

08/08 19:34, , 31F
然而是否只能做簡單直線迴歸? 是否僅有一解釋變數可用?
08/08 19:34, 31F

08/09 14:32, , 32F
謝謝指教... 我又多學一點點了...
08/09 14:32, 32F
文章代碼(AID): #1CNY2_R3 (Statistics)