[問題] Imputation
想請問在針對有 missing value 的資料作 impute 時,
若我現在有一 impute 的方法,
(大概簡述一下,會用這方法的原因是在於這方法考慮比較詳盡的條件及情形,
而且 error rate 也比其它方法較低,較廣為人使用)
它需要 reference data 來對我現有的資料(study sample)作 impute,
但我的 study sample 並非皆能有對應的 reference data,
(所謂的對應是指 reference data 和 study data 都有的 predicotrs)
因此,如果我一部分的資料(有對應的 reference data)用此方法,
另一部分無法對應的資料用其它方法,可行嗎?
(我個人是不偏向同一 sample 用不同的方法,很怕之後分析結果會偏向某 imputation
方法所得的結果,也可能是我想太多啦…)
再者,如果 imputation 這部分解決了,
我針對原始資料,踢除有 missing value 的 individuals (仍剩1000多筆),
作跟 imputation 後的資料同樣的分析,再比對兩種 data 分析的結果,
這樣… 有意義嗎?
(畢竟 imputation 仍會有些 error ,我會比較期望有經過 impute 動作所挑出顯著的
predictors 在沒有 impute 動作下也能看到,是不是多此一舉?)
若您有任何想法,還請告訴我,謝謝!! <(_ _)>
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.74.141