[問題] 變項轉換IV值
我用了一個可算informaiton value的package
某變項IV顯著 但把此變項轉成catgorical的7個變項 完全不顯著
data set中有一個變項是income 是用數字表示順序性的範圍
ex: 1:20K-25K 2:26K-35K 3:....... 7:200K以上
變項是 income_level IV值顯著
如果把變項轉換成 income_1 ....income_7 7個變項 沒有一個變項IV顯著
請問為甚麼會有這種現像呢?
究竟income可採納嗎?
我目前是姑且相信它可採納 但是我使用轉換後的7個變項進行預測
這樣的作法會有問題嗎? (apply 到一個logistic的model)
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.210.58.35
※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1409799069.A.4FC.html
推
09/04 17:19, , 1F
09/04 17:19, 1F
→
09/04 17:20, , 2F
09/04 17:20, 2F
→
09/05 16:54, , 3F
09/05 16:54, 3F
→
09/05 16:56, , 4F
09/05 16:56, 4F
→
09/05 16:56, , 5F
09/05 16:56, 5F
→
09/05 16:59, , 6F
09/05 16:59, 6F
→
09/05 16:59, , 7F
09/05 16:59, 7F
→
09/05 17:01, , 8F
09/05 17:01, 8F
→
09/05 17:02, , 9F
09/05 17:02, 9F
→
09/05 17:03, , 10F
09/05 17:03, 10F
→
09/05 17:04, , 11F
09/05 17:04, 11F
→
09/05 17:04, , 12F
09/05 17:04, 12F
→
09/05 23:29, , 13F
09/05 23:29, 13F
謝謝大家分享指教
※ 編輯: cawaiilulu (24.210.58.35), 09/08/2014 03:08:44