Re: [問題] 交互作用負負相乘的問題

看板Statistics作者Prozac (沒事不要亂吃)時間13年前 (2010/10/07 21:42)推噓10(10推 0噓 137→)

留言147則, 8人參與討論串3/5 (看更多)

可討論的點很多不過既然原po提到用中心化處理共線性那我就以這點分享一點看法我不認為中心化主要目的是處理共線性的問題一般而言共線性來自於迴歸係數的估計式會受到獨變數之間的相關影響公式請詳見迴歸書或是一般統計書對於加入的連乘積項X1X2可能會造成共線性的問題改為中心化的C1C2可能可以處理這問題但也不是屢試不爽的好方法剛剛隨便弄了個例子就發現中心化反而相關上升我會從交互作用的意義來看中心化的好處中心化(centering) 最簡單的想法就像計算共變數公式要去中心一樣減掉平均數是為了控制兩變數在同一個起始點上看兩變數之間的大小關係是否有所相關有的話共變程度大沒有的話共變程度小 > 也可以套至相關那為何處理調節變項要去中心化？我先來談調節變項的意義簡單而言，調節變項是捕捉交互作用的效果交互作用的效果可以稱為某獨變項影響依變項的效果受到另一個讀變項的影響的效果很饒口對吧？那簡單一點來講交互作用就是非線性的效果的一種從定義把數學式子寫一寫就很簡單了假設X1的對Y的預測能力（或是說效果影響等等都可以）受到X2的大小影響也就是X2的大小會影響到X1影響Y的效果或是預測能力以上可以寫成 Y = a0 + (a1 + a2X2)X1 + a3X2 = a0 + a1X1 + a3X2 + a1a2X1X2 = B0 + B1X1 + B2X2 +B3X1X2 在數學上X1X2就是一個非線性的效果我們可以說因為存在交互作用因此單就線性模型Y = B0 + B1X1 + B2X2 不足夠需要在加上X1X2的乘積項捕捉交互作用的效果那如果不作中心化會怎樣？此時B3會很難解釋！！ X1X2上升一單位在沒有中心化處理下意義完全不明！因為X1 X2 可能一個是身高一個是5點量表他們的乘積上升一單位？嗯？沒人知道那是啥鬼但是中心化後 X1X2上升一單為的意義就是兩者往共同方向移動了一單位這就會讓研究者方便許多那既然如此我就來在推導一下其實中心化就只是針對X1X2的乘積項至於X1 和 X2 其實是可以不需要中心化的上一篇提到的那本回歸參考書（A先生＆W先生）也有提到這點令C1為中心化過的X1 M1為X1的平均數 Y = b0 + b1X1 + b2X2 + b3C1C2 = b0 + b1C1 + b2C2 + b3C1C2 + b1M1 + b2M2 = b0'+ b1C1 + b2C2 + b3C1C2 也就是說不管X1放的是原始資料還是中心化過的C1 這都只影響到截距項的估計對其他係數不會任何影響～詳細推導請參考書籍以上只是一點淺見 -- 額外話每次看到有人用工讀生時薪在徵統計分析幫手都覺得囧或許某些老師覺得統計就是點一點寫寫語法而已沒啥了不起就把資料丟進去把結果給他然後他就可以寫paper 科科 ※ 引述《coldwind0912 (隨風而逝~)》之銘言： : 我是用一個比較簡單的方法來舉例 : 我在舉一個例子 : x1 x2 x1x2 : case1 6 9 54 : case2 2 3 6 : 假設x1 mean=4 x2 mean=6 : 所以中心化之後： : x1' x2' x1'x2' : case1 2 3 6 : case2 -2 -3 6 : 請問c大這樣一樣是合理的嗎？謝謝？ : 我還是不太懂你的意思:) : 從你這個例子來說 : 當我們假定 X1 X2 都是一個 0~10 的分數正代表滿意負代表不滿意 : ※(其實負分根本不存在因為尺度是0~10 不會有負) : 在csae1的情況當X1在中心化前是6 中心化後是2 : 對於X1的意義而言不論是6還是2 都是代表滿意 : 可是如果太執著數字大小會誤認為在中心化後滿意度降低了(這是錯的觀念) : 實際上中心化前的6分和中心化後的2分是一樣的 : 因為尺度已經從 0~10 變成 -4 ~ 6 (Mean=4，同減) : 但是首先會有問題的是X1在case2的時候 : 在case2的情況 X1在中心化前是2 中心化後是-2 : 但是對於X1的意義而言不論是2還是-2 一樣都還是代表滿意(請見前述※處) : 實際上中心化前的2分和中心化後的-2分是一樣的 : 因為尺度已經從 0~10 變成 -4 ~ 6 (Mean=4，同減) : 最後就是交互作用項的問題 : 基本上這也是這個問題當中最複雜的一點 : 因為交互作用的說明不是直接以數字的正負或大小就能理解的 : 以CASE1 來說你一定會問中心化前的54 中心化後的6 為什麼會變化那麼多? : 以CASE2 來說你就是問中心化前的6 和中心化後負負得正的6 是一樣的嗎? : 其實這裡我也很難以一個中文說法來表達 : 不過基本上對於中心化的議題大部份都是參考Aiken&West(1991)的paper : 或許這麼說好了(也許會有點言不及意這是我個人的解讀) : 不論是case1的54和6 或case2的6和6 : 基本上它都是「反應X1和X2同時在Y上高低程度的共同比例效果」 : 只是在中心化前會受平均數的影響 : 但是就這個例子而言 : case1的x1和x2為6,9 case2為2,3 其實這比例效果是一樣的(中心化後都為6) : 所以回到問題中心化的操作或許很簡單但是中心化的意義很複雜 : 有時不要用正負、大小就直接思考判斷 : 在交互作用的議題裡這種直觀式的判斷往往都是錯的 : 也希望有板上其他高手來進一步說明或一討論這個中心化的問題吧我的能力也有限 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.224.49.80

推

coldwind0912

10/07 21:52, , 1^F

10/07 21:52, 1^F

→

coldwind0912

10/07 21:53, , 2^F

10/07 21:53, 2^F

→

coldwind0912

10/07 21:53, , 3^F

10/07 21:53, 3^F