[問題] 避免錯誤地合併資料
不洽當的合併資料, 諸如合併不同處理、不同類別、去除重要因子等,
在分析上容易引導錯誤結論,其中最著名的例子是 Simpson's paradax。
我想請問諸位版友的問題是,有效避免這項問題的操作性方法是什麼?
例如,在一個複雜的一般線性模型中,我將模型中不重要的自變數刪除。
在這個過程中,常見的例子是交互作用不重要拿掉、相關太低的自變數拿掉……
但我怎麼知道我真的只拿掉了和應變數沒瓜葛的變數呢?
不知道可否請板友提供一些操作性的判別方法?非常感謝。
(不然我常常吵不贏老闆啊……)
--
http://apansharing.blogspot.com/
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 125.230.68.146
→
03/25 23:10, , 1F
03/25 23:10, 1F
→
03/27 16:59, , 2F
03/27 16:59, 2F
→
03/27 17:00, , 3F
03/27 17:00, 3F
→
03/27 17:01, , 4F
03/27 17:01, 4F
→
03/27 17:02, , 5F
03/27 17:02, 5F
→
03/27 17:03, , 6F
03/27 17:03, 6F
→
03/27 17:58, , 7F
03/27 17:58, 7F