[問卦] 嚴重資料不平衡的小資料,推薦用什麼模型

看板Gossiping作者 (微,U文)時間5年前 (2020/11/24 13:45), 5年前編輯推噓-4(3712)
留言22則, 19人參與, 5年前最新討論串1/1
欸欸肥宅 小妹我女友問我的 叫我上來問資工肥宅你們啦 她有一份資料 只有大概400組data可以用 每個data大概有20000個特徵 然後是二分法 但1的大概只有30個 剩下0的有大概300多個 非常不平衡呢 小妹我女友用了隨機森林KNN SVM 效果都很差啦 Precision 跟 recall還有F1都超低 怎辦啊 再不解決小妹我女友就要哭哭了 有卦嗎 ----- Sent from JPTT on my iPhone -- 我是 - 微,U文 專發 - 微,優文 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.114.9.67 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1606196744.A.2B7.html

11/24 13:45, 5年前 , 1F
11/24 13:45, 1F

11/24 13:46, 5年前 , 2F
先醒醒 你沒有女友
11/24 13:46, 2F

11/24 13:46, 5年前 , 3F
啥模型都沒用 484套套黨連這都問阿
11/24 13:46, 3F

11/24 13:46, 5年前 , 4F
建議 用鋼彈模型
11/24 13:46, 4F

11/24 13:47, 5年前 , 5F
套出來一樣是垃圾
11/24 13:47, 5F

11/24 13:47, 5年前 , 6F
knn
11/24 13:47, 6F

11/24 13:47, 5年前 , 7F
作業自己做
11/24 13:47, 7F

11/24 13:48, 5年前 , 8F
鋼彈模型
11/24 13:48, 8F

11/24 13:49, 5年前 , 9F
借學長訓練好的阿法狗分類
11/24 13:49, 9F

11/24 13:49, 5年前 , 10F
問功課不可取,假裝有女友則可恥
11/24 13:49, 10F

11/24 13:50, 5年前 , 11F
資料探勘作業自己做啦
11/24 13:50, 11F

11/24 13:50, 5年前 , 12F
聽起來就是什麼屁都不懂以為套套模型就算會機器學習
11/24 13:50, 12F

11/24 13:50, 5年前 , 13F
把資料分組訓練啦幹
11/24 13:50, 13F

11/24 13:51, 5年前 , 14F
認真回random forest先套下去看feature importance
11/24 13:51, 14F
都先用xgboost看了

11/24 13:51, 5年前 , 15F
knn一定能分開啦 除非真的一坨全部同樣的
11/24 13:51, 15F

11/24 14:04, 5年前 , 16F
作業請自己做
11/24 14:04, 16F

11/24 14:06, 5年前 , 17F
隨機森林 k fold Knn
11/24 14:06, 17F

11/24 14:14, 5年前 , 18F
Smote
11/24 14:14, 18F
早就用啦 ※ 編輯: WeiU (140.112.16.134 臺灣), 11/24/2020 14:23:32

11/24 14:41, 5年前 , 19F
Markov chain clustering,我以前在做fuzzy pattern
11/24 14:41, 19F

11/24 14:41, 5年前 , 20F
matching用效果還不錯
11/24 14:41, 20F

11/24 14:53, 5年前 , 21F
.叫學長學弟做啊
11/24 14:53, 21F

11/24 15:13, 5年前 , 22F
鋼彈模型~
11/24 15:13, 22F
文章代碼(AID): #1Vl9u8At (Gossiping)