Re: [程式] SPSS, dummy和exclude variable的問題

看板Statistics作者 (allwin)時間10年前 (2013/12/04 08:30), 編輯推噓1(1027)
留言28則, 3人參與, 最新討論串2/2 (看更多)
※ 引述《saxonwing (翾刖)》之銘言: : [軟體程式類別]: : SPSS : [程式問題]: : dummy coding及exclude variable : [軟體熟悉度]: : 高(1年以上) : ←雖然算常用,但其實真的沒有很熟,會用到的就是那幾樣 : [問題敘述]: : 想請教大家幾個問題,被卡到快抓狂了orz : (1)dummy coding的時候,使用0跟1或1跟2有差嗎? : 在我過去的上課和使用經驗當中,dummy就是使用0和1 : 我所需要處理的變項是性別,一開始就設定為男性=1,女性=2 : 但是這次在分析資料的時候,發現了一個狀況 : 有一份問卷是實驗進行到一半的時候才加入的 : 因此前20個受試者都沒有這份問卷的數據 : 當我將性別與該份問卷的數據相乘想看交互作用時 : 前20個應該是遺漏值的受試者有些卻出現了0 : 也就是說,男性(1)*問卷分數沒問題,遺漏的部分就還是沒有數據 : 但是女性(0)*問卷分數,本該是遺漏的地方卻是0 : 這個問題我一直解決不了,換成99並設定遺漏值也是同樣的狀況 : 因此我聽從學校老師的建議,將性別置換成1跟2 : 就沒有再出現這個狀況 : 但我手邊的工具書和課本、外校的統計老師以及在網路上找到的範例 : dummy都是以1跟0去做編碼 : 所以我想請問大家,到底dummy能不能用1跟0以外去編碼 : 還是就像那個老師說的,只要不一樣即可? 如果有加入交互作用項的話,dummy用0、1和用1、2會有不同的係數。 如果沒有交互作用項的話,dummy用0、1出來的結果和用1、2是一致的。 沒有交互作用時: y=β1*dummy+β2*問卷分數+ε 當dummy為0=女和1=男時: 女的分數:y女=β2*問卷分數+ε 男的分數:y男=β1+β2*問卷分數+ε 當dummy為1=女和2=男時: 女的分數:y女=β1+β2*問卷分數+ε 男的分數:y男=β1*2+β2*問卷分數+ε 請注意:此時兩者的差別出現在β1,因為β1是常數,所以基本上dummy設為0、1 或設為1、2,產生的變項係數會一致(也就是兩者的差別是在截距項)。 試著思考您的方程式應該如下: y=β1*dummy+β2*問卷分數+β3*dummy*問卷分數+ε 當dummy為0=女和1=男時: 女的分數:y女=β2*問卷分數+ε 男的分數:y男=β1+β2*問卷分數+β3*問卷分數+ε 當dummy為1=女和2=男時: 女的分數:y女=β1+β2*問卷分數+β3*問卷分數+ε 男的分數:y男=β1*2+β2*問卷分數+β3*問卷分數*2+ε 請注意:此時dummy為0、1時,女生沒有β3的估計值; 但是dummy為1、2時,女生有β3的估計值。因為β3的估計值是跟著變項(問卷分數)而動, 所以變項的係數估計值在dummy為0、1以及dummy為1、2間會不同。 PS.用dummy為0、1時,你可以先用「選擇觀察值」的功能先使用「無問卷分數遺漏」的 個案進行compute,爾後再用全部觀察值來跑regression。 這樣就可以解決你女生交互項出來為0的狀況。 另外,case數如果少的話,也可以考慮手動遺漏值 : (2)用Enter法卻出現Exclude variable : 接續上面 : 當我進行回歸的交互作用分析時 : 是使用Enter法將變項一層一層丟進去 : 例如想看性別與A、B問卷的交互作用 : 第一層是丟"性別、A、B" : 第二層丟"性別*A、性別*B、A*B" : 第三層是丟"性別*A*B" : 分明不是使用stepwise,output卻出現exclude variable : 直接把我的交互作用項踢掉 : 我不知道為什麼會出現這個問題 : 是因為共線性過高的關係嗎?那要如何處理呢? : 請大家救救我QQ : [程式範例]: : REGRESSION : /MISSING LISTWISE : /STATISTICS COEFF OUTS R ANOVA : /CRITERIA=PIN(.05) POUT(.10) : /NOORIGIN : /DEPENDENT DELTA_32 : /METHOD=ENTER gender NMR_total SSRT : /METHOD=ENTER GxN GxSSRT NxSSRT : /METHOD=ENTER G_N_SSRT. : (平常是直接點視窗上的按鈕,上面是點完paste出來的) 我猜測你是沒看懂報表。 因為你用的是hierarchical regression。 所以基本上報表會報出每一層沒有納入的變項,另列一個exclude variable的報表。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 36.238.89.73

12/04 13:54, , 1F
謝謝S大的回應!因為我的模式中,必須包含交互作用項
12/04 13:54, 1F

12/04 13:56, , 2F
依照s大的說明,用1,2和用1,0的beta值會不同,那我想
12/04 13:56, 2F

12/04 13:57, , 3F
請問,在這種狀況下,使用1,2畫出來的交互作用圖是正
12/04 13:57, 3F

12/04 13:58, , 4F
確的嗎?而包含交互作用的模式中,使用1,2是OK的嗎?
12/04 13:58, 4F

12/04 14:00, , 5F
另外也想請教s大,我的output中,除了另有一個exclude
12/04 14:00, 5F

12/04 14:03, , 6F
variavle table之外,交互作用項確實在coefficients
12/04 14:03, 6F

12/04 14:04, , 7F
表中直接消失,也就是根本沒有出現model 3,這樣是正確
12/04 14:04, 7F

12/04 14:05, , 8F
的嗎?我原先以為即使是階層回歸,只要每層進入時使用
12/04 14:05, 8F

12/04 14:05, , 9F
Enter法,就不會有變項被自動踢掉的問題?
12/04 14:05, 9F

12/04 14:40, , 10F
交互作用的部分,我會比較保守地使用0,1
12/04 14:40, 10F

12/04 14:41, , 11F
依你的syntax來看,照理說應該都會跑出來,而且你的
12/04 14:41, 11F

12/04 14:41, , 12F
交互作用項是在第二層,所以報表出來是直接跳過層二,
12/04 14:41, 12F

12/04 14:41, , 13F
然後報導出層一和層三的數值嗎?
12/04 14:41, 13F

12/04 14:42, , 14F
有沒有output的報表可以看呢?
12/04 14:42, 14F

12/04 15:29, , 15F
12/04 15:29, 15F

12/04 15:30, , 16F
抱歉沒說清楚,第三層是3 way interaction,在output
12/04 15:30, 16F

12/04 15:31, , 17F
中第三層不見了。謝謝s大耐心回答我的問題,真的!
12/04 15:31, 17F

12/04 15:59, , 18F
我現在能想到的就是你3 way interaction可能是常數
12/04 15:59, 18F

12/04 15:59, , 19F
建議你回頭檢查一下raw data
12/04 15:59, 19F

12/04 16:10, , 20F
sk2allwin的解釋很詳細,贊,我補充一點。用什麼coding
12/04 16:10, 20F

12/04 16:11, , 21F
其實無所謂,例如除了dummy coding,還有effect coding,
12/04 16:11, 21F

12/04 16:11, , 22F
關鍵要理解coefficent在不用coding下的含義有所不同罷了
12/04 16:11, 22F

12/04 16:14, , 23F
例如,採用0 1coding,constant表示的是當gender=0,即女生
12/04 16:14, 23F

12/04 16:15, , 24F
採用1 2 coding,constant表示的是當gender=0,即非男非女
12/04 16:15, 24F

12/04 18:31, , 25F
謝謝s大和b大,我想請問一下,3 way是常數是什麼意思?
12/04 18:31, 25F

12/04 20:23, , 26F
也就是你所有個案的分數都是一樣的
12/04 20:23, 26F

12/04 23:19, , 27F
我檢查了我的raw data,沒有分數一樣的狀況,現在想說
12/04 23:19, 27F

12/04 23:19, , 28F
用1,0重來一次試試看,如果再不行我也不知道了...
12/04 23:19, 28F
文章代碼(AID): #1IddU_AE (Statistics)
文章代碼(AID): #1IddU_AE (Statistics)