[問題] 在GEE中的遺漏值該如何處理
最近使用GEE的時候遇到了一些問題,那就是GEE似乎會將任一變項有遺漏的觀察值刪去
簡單的說,假設變項有A,B,C三個(假設接類別)
ID A B C
觀察值1 1 0 .
觀察值2 0 . 1
觀察值3 1 . 0
觀察值4 0 1 .
觀察值5 . 1 1
(.代表missing)
這樣觀察值1到觀察值5全部都不會被納入模式中分析
這個問題困擾著我,我試著用模擬數據將遺漏值填上其他數字,但結果好像會導致係數估計
值的不準確
如下列的模擬數據
ID 次數 依變項 自變項1 自變項2
101 0 50 0 0
101 1 47 0 0
102 0 45 0 1
102 1 40 0 1
103 0 45 0 1
103 1 40 0 1
104 0 40 1 0
104 1 32 1 0
105 0 35 1 1
105 1 22 1 1
106 0 40 1 0
106 1 32 1 0
107 0 35 . 1 自變項1其實為1
107 1 25 . 1 自變項1其實為1
108 0 50 . 0 自變項1其實為0
108 1 47 . 0 自變項1其實為0
模式包含下列變數:
次數, 自變項1, 自變項2, 自變項1*次數, 自變項2*次數, 自變項1*自變項2*次數
我希望計算出來的數值為(都用1與0相比):
次數=-3
自變項1=-10
自變項2=-5
自變項1*次數=-5
自變項2*次數=-2
自變項1*自變項2*次數=-3
使用此一模擬數據,若刪除遺漏值則可以得到我想要的答案,但若隨便將遺漏值填上2,則會
使結果出現完全不同的答案,因為2這個類別混雜了0和1
因此希望求助於各位,看有沒有什麼好的方法能夠解決此一問題,因為小弟需要執行的任務
可能有將近1000個自變項,原始的資料僅有2600筆觀察值左右,若刪除了任一變項有遺漏的
觀察值,剩不到1000個
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 210.60.122.8
→
08/01 11:48, , 1F
08/01 11:48, 1F
→
08/01 13:27, , 2F
08/01 13:27, 2F
→
08/01 22:21, , 3F
08/01 22:21, 3F
→
08/02 00:09, , 4F
08/02 00:09, 4F