[問題] 多個模型比較問題

看板Statistics作者 (kobe)時間7年前 (2018/11/02 21:20), 7年前編輯推噓2(203)
留言5則, 3人參與, 7年前最新討論串1/1
想請問各位大大,目前小弟在工作上用了一個二分類模型 預測率來到 90%,但老闆不太滿意,問說假如要99% 怎麼辦 小弟提出一個想法,目前有三個差不多的模型 分別為SVM 深度學習 隨機森林 都有接近 90% 的準確 我倒入一組新的樣本(假設未知標籤),讓三個去辨別, 選擇三個模型中最多人判別的結果,再把另一個當作判別錯誤 丟進去那個模型的 train data,重新訓練模型,請問這樣是可行的嗎 會造成什麼問題嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.172.92.239 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1541164835.A.7A9.html ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:21:28

11/02 21:53, 7年前 , 1F
試過ensamble沒?
11/02 21:53, 1F
c大學長您好,由於在校沒學過您說的,目前沒試過。 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:08 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:22 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:49 ※ 編輯: kero961240 (1.172.92.239), 11/02/2018 22:07:50

11/02 22:21, 7年前 , 2F
我覺得應該先研究一下在各模型中誤判的樣本有何特徵
11/02 22:21, 2F

11/03 21:09, 7年前 , 3F
Feature多嗎?多的話可能會遇到curse of dimensionali
11/03 21:09, 3F

11/03 21:09, 7年前 , 4F
ty, 這時ensemble會是可能有效解法(同意樓上建議)
11/03 21:09, 4F
大大您好,我只能說維度超多,我們根本沒縮減 ※ 編輯: kero961240 (1.172.112.140), 11/03/2018 22:53:06

11/04 02:54, 7年前 , 5F
那就ensemble試看看,
11/04 02:54, 5F
文章代碼(AID): #1Rt4yZUf (Statistics)