[問題] 建立兩個模型的必要性?

看板Statistics作者 (across)時間11年前 (2014/09/04 10:37), 11年前編輯推噓1(109)
留言10則, 5人參與, 最新討論串1/1
想問問版友一個問題 當資料是由兩類人組成 要怎麼決定是建一個模型就好 還是建立兩個模型? 資料是這樣的: 預測binary決策(購買某保險) 用logistic 問題來了 其實樣本是由兩群人組成的 這兩群人有一群是單A國籍 另外一群人是AB雙重國籍 所以 AB雙重國籍者 也會擁有A單國籍者的variables 但是單A不會有B國籍的資料 例如 國家居住年限 國家繳稅與否 .... 目前 兩群人購買其他某保險的比率是 (80:20 73:27) 我現在有點傷腦筋是 到底應該怎麼判斷 是不是應該分開建模型 還是全弄在一個反正沒該項資料的就補0就好了.... 有任何學理上的標檢驗判斷準作法嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.210.58.35 ※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1409798237.A.CD0.html

09/04 17:17, , 1F
淺見:模式一個 只有A有的資料不放入
09/04 17:17, 1F

09/04 20:44, , 2F
我的想法是...模型一:只納入A國籍,模型二:只納入雙重國
09/04 20:44, 2F

09/04 20:47, , 3F
個模型較優.僅供參考^^
09/04 20:47, 3F

09/04 20:48, , 4F
模型二:只納入雙重國籍,模型三:建一個國籍變數,A國給0,
09/04 20:48, 4F

09/04 20:48, , 5F
雙重給1,最後比較哪個模型較優,僅供參考
09/04 20:48, 5F

09/04 22:16, , 6F
大方向是:你的母體為何?
09/04 22:16, 6F
母體是購買過某保險公司某類產品的人 這些人不然就是a單國籍 不然就是ab雙重國籍

09/05 02:34, , 7F
multigroup model
09/05 02:34, 7F

09/05 02:36, , 8F
但是它有一些假設,請參照你的研究問題y
09/05 02:36, 8F

09/05 16:50, , 9F
建議分別建模, 可以避免一些麻煩. 單一模型固然有其可取之
09/05 16:50, 9F

09/05 16:50, , 10F
處, 但也有一些條件需要考慮, 需要檢查.
09/05 16:50, 10F
謝謝大家分享指教 ※ 編輯: cawaiilulu (24.210.58.35), 09/08/2014 03:09:08
文章代碼(AID): #1K1z1TpG (Statistics)