[程式] missing value處理方法(SPSS)
我用的分析方法是logistic regression
因為系統設定為listwise deletion 所以造成我最後有接近20%的missing value
為了降低missing value的數目
我用mean value去取代了大部分missing value percentage低於5%的IV
但是最後仍有約15%的missing value
來源為我的一個很重要的IV(8.8%)和DV(7.0%)
我們老師跟我說那就至少做一個T-test
證明missing value而被delete的數值和最後保留分析的數值
這兩組group在sex income和age等項目都是沒有差異的
我的syntax如下:
RECODE iv (MISSING=1) (else=0) INTO riv.
RECODE dv (MISSING=1) (else=0) INTO rdv.
COMPUTE group=1.
IF (riv EQ 1 or rdv EQ 1) group=2.
T-TEST GROUPS=group(1 2)
/MISSING=ANALYSIS
/VARIABLES=sex
/CRITERIA=CI(.95).
但很不剛好的是 我T-test做出來的結果證明他們之間是有差異的......
我現在的想法是我用mean value去取代我的IV 讓整體missing value降低
我不知道這樣可不可以 因為他missing value超過了5%
但如果不這樣做的話 這個15%missing value的問題還有其他解決辦法嗎?
還是這樣的數據結果真的就不能夠發表了......
希望有經驗的前輩們可以給我些想法 非常謝謝你們:)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 76.208.68.175
→
05/06 15:24, , 1F
05/06 15:24, 1F
→
05/06 15:24, , 2F
05/06 15:24, 2F
→
05/06 15:25, , 3F
05/06 15:25, 3F
→
05/06 15:25, , 4F
05/06 15:25, 4F
→
05/06 15:28, , 5F
05/06 15:28, 5F
→
05/06 15:30, , 6F
05/06 15:30, 6F
→
05/06 15:31, , 7F
05/06 15:31, 7F
→
05/06 15:32, , 8F
05/06 15:32, 8F
→
05/06 15:33, , 9F
05/06 15:33, 9F
→
05/06 15:33, , 10F
05/06 15:33, 10F
推
05/06 16:40, , 11F
05/06 16:40, 11F
→
05/07 00:19, , 12F
05/07 00:19, 12F
→
05/07 00:19, , 13F
05/07 00:19, 13F
→
05/07 00:20, , 14F
05/07 00:20, 14F