[問題] 建立兩個模型的必要性?
想問問版友一個問題
當資料是由兩類人組成 要怎麼決定是建一個模型就好 還是建立兩個模型?
資料是這樣的: 預測binary決策(購買某保險) 用logistic
問題來了 其實樣本是由兩群人組成的 這兩群人有一群是單A國籍
另外一群人是AB雙重國籍
所以 AB雙重國籍者 也會擁有A單國籍者的variables 但是單A不會有B國籍的資料
例如 國家居住年限 國家繳稅與否 ....
目前 兩群人購買其他某保險的比率是 (80:20 73:27)
我現在有點傷腦筋是 到底應該怎麼判斷 是不是應該分開建模型
還是全弄在一個反正沒該項資料的就補0就好了....
有任何學理上的標檢驗判斷準作法嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.210.58.35
※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1409798237.A.CD0.html
推
09/04 17:17, , 1F
09/04 17:17, 1F
→
09/04 20:44, , 2F
09/04 20:44, 2F
→
09/04 20:47, , 3F
09/04 20:47, 3F
→
09/04 20:48, , 4F
09/04 20:48, 4F
→
09/04 20:48, , 5F
09/04 20:48, 5F
→
09/04 22:16, , 6F
09/04 22:16, 6F
母體是購買過某保險公司某類產品的人 這些人不然就是a單國籍 不然就是ab雙重國籍
→
09/05 02:34, , 7F
09/05 02:34, 7F
→
09/05 02:36, , 8F
09/05 02:36, 8F
→
09/05 16:50, , 9F
09/05 16:50, 9F
→
09/05 16:50, , 10F
09/05 16:50, 10F
謝謝大家分享指教
※ 編輯: cawaiilulu (24.210.58.35), 09/08/2014 03:09:08