[問題] 在GEE中的遺漏值該如何處理

看板Statistics作者 (Syameroke)時間12年前 (2012/08/01 11:17), 編輯推噓0(004)
留言4則, 3人參與, 最新討論串1/1
最近使用GEE的時候遇到了一些問題,那就是GEE似乎會將任一變項有遺漏的觀察值刪去 簡單的說,假設變項有A,B,C三個(假設接類別) ID A B C 觀察值1 1 0 . 觀察值2 0 . 1 觀察值3 1 . 0 觀察值4 0 1 . 觀察值5 . 1 1 (.代表missing) 這樣觀察值1到觀察值5全部都不會被納入模式中分析 這個問題困擾著我,我試著用模擬數據將遺漏值填上其他數字,但結果好像會導致係數估計 值的不準確 如下列的模擬數據 ID 次數 依變項 自變項1 自變項2 101 0 50 0 0 101 1 47 0 0 102 0 45 0 1 102 1 40 0 1 103 0 45 0 1 103 1 40 0 1 104 0 40 1 0 104 1 32 1 0 105 0 35 1 1 105 1 22 1 1 106 0 40 1 0 106 1 32 1 0 107 0 35 . 1 自變項1其實為1 107 1 25 . 1 自變項1其實為1 108 0 50 . 0 自變項1其實為0 108 1 47 . 0 自變項1其實為0 模式包含下列變數: 次數, 自變項1, 自變項2, 自變項1*次數, 自變項2*次數, 自變項1*自變項2*次數 我希望計算出來的數值為(都用1與0相比): 次數=-3 自變項1=-10 自變項2=-5 自變項1*次數=-5 自變項2*次數=-2 自變項1*自變項2*次數=-3 使用此一模擬數據,若刪除遺漏值則可以得到我想要的答案,但若隨便將遺漏值填上2,則會 使結果出現完全不同的答案,因為2這個類別混雜了0和1 因此希望求助於各位,看有沒有什麼好的方法能夠解決此一問題,因為小弟需要執行的任務 可能有將近1000個自變項,原始的資料僅有2600筆觀察值左右,若刪除了任一變項有遺漏的 觀察值,剩不到1000個 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 210.60.122.8

08/01 11:48, , 1F
what's wrong with conducting a complete-case analysis?
08/01 11:48, 1F

08/01 13:27, , 2F
簡單的說我希望像Linear regression那樣,遺漏不需要刪除
08/01 13:27, 2F

08/01 22:21, , 3F
Linear regression不會刪嗎@@? 我記得也會耶
08/01 22:21, 3F

08/02 00:09, , 4F
有方法可以成對排除之類的...
08/02 00:09, 4F
文章代碼(AID): #1G69_HFE (Statistics)