[問題] 請問關於遺漏值
我目前的研究是有關行車記錄器~~
但是是鐵路的~~
假設有發生記錄~~他就會像以下狀況
年齡 年資 車種 時段 下坡 下雨 減速率不足(Y)
40 10 2 2 1 1 1
但是如果沒發生事件,就會變成以下狀況
年齡 年資 車種 時段 下坡 下雨 減速率不足(Y)
40 10 2 無 無 無 0
我之前都會把"無"的建一個值代表"未發生"
用SPSS跑Logistic Regression (Backward)時
他在第一步驟就會刪除~~
直到最後跑出結果
但是因為資料有Panel Data問題(92個司機產生3844筆資料)
而且資料可能本身具有相關性
改用SPSS裡面的GEE概化線性模式
原本的定義"無"的新值就沒有辦法跑GEE......
後來把定義"無"的新值都改回空格~~
SPSS則會自動忽略遺漏值.....
原本3844筆進去跑....只有609筆完整記錄會進去跑...
有什麼方法可以克服這種狀況嗎.....
--
╭══╮ ☆
║ ╯ ︶
☆ ║ ╭╮╦ ╦ ╦ ╭═╮
║ ║║ ║ ║ ╰═╮ ☆
╰══╯╰─╯ ╩ ╰═╯
☆
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.127.163.165