[問題] 等深分箱法

看板R_Language作者 (Richie)時間6年前 (2017/12/03 12:15), 編輯推噓2(203)
留言5則, 2人參與, 6年前最新討論串1/1
最近老師上課有提到分箱法 有等寬、等深分箱法 他是要取 CSV 檔的欄位去算 等寬分箱法已經知道怎麼使用 就是先讓數值排序 接著算出最大最小值 然後在分成要的等分 就可以用 cut 分群出來 但是等深卻一直用不出來 等深是用資料的數量 但是用 cut , split 都沒有辦法 最後還是用迴圈去寫 但是感覺這就不是真正的方法 想請問有高手能教教剛入門的菜鳥嗎 謝謝各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.9.230.21 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1512274551.A.EC9.html

12/03 13:09, 6年前 , 1F
查查看 cross validation ,有看到類似的東西
12/03 13:09, 1F

12/03 22:28, 6年前 , 2F
假設分 K 箱
12/03 22:28, 2F

12/03 22:30, 6年前 , 3F
breaks = unique(quartile(x,probs=seq(0,1,length=K
12/03 22:30, 3F

12/03 22:30, 6年前 , 4F
+1)))
12/03 22:30, 4F

12/03 22:31, 6年前 , 5F
new_x=cut(x,breaks,include.lowest=T,right=F)
12/03 22:31, 5F
文章代碼(AID): #1Q8tftx9 (R_Language)