[問題] 避免錯誤地合併資料

看板Statistics作者 (apan)時間12年前 (2013/03/25 22:52), 編輯推噓0(007)
留言7則, 3人參與, 最新討論串1/1
不洽當的合併資料, 諸如合併不同處理、不同類別、去除重要因子等, 在分析上容易引導錯誤結論,其中最著名的例子是 Simpson's paradax。 我想請問諸位版友的問題是,有效避免這項問題的操作性方法是什麼? 例如,在一個複雜的一般線性模型中,我將模型中不重要的自變數刪除。 在這個過程中,常見的例子是交互作用不重要拿掉、相關太低的自變數拿掉…… 但我怎麼知道我真的只拿掉了和應變數沒瓜葛的變數呢? 不知道可否請板友提供一些操作性的判別方法?非常感謝。 (不然我常常吵不贏老闆啊……) -- http://apansharing.blogspot.com/ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 125.230.68.146

03/25 23:10, , 1F
因該說入門者要知道資料的形態吧 用is.XXXX之類的指令
03/25 23:10, 1F

03/27 16:59, , 2F
拿掉不重要的潛在解釋變數或效應項是必要的. 評估的標準就是
03/27 16:59, 2F

03/27 17:00, , 3F
被拿掉的確實不重要. 而要避免因忽略重要解釋變數或效應項而
03/27 17:00, 3F

03/27 17:01, , 4F
扭曲了事實, 要做的就是檢查、思考: 有沒有可能哪些解釋變數
03/27 17:01, 4F

03/27 17:02, , 5F
或效應項被忽略了? 這些問題, 就是線性模型(線性迴歸模型)以
03/27 17:02, 5F

03/27 17:03, , 6F
及其他統計模型之 "模型建構、選擇與診斷" 主題中所探討的.
03/27 17:03, 6F

03/27 17:58, , 7F
知道方向了,謝謝。
03/27 17:58, 7F
文章代碼(AID): #1HK6IaOS (Statistics)