[問題] xgboost regression

看板R_Language作者 (小笨)時間8年前 (2016/07/13 14:48), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
首先我先貼出資料 train https://drive.google.com/file/d/0B3xY9FMzjybzZ1pCTDE1cE1yVmM/view?usp=sharing test https://drive.google.com/file/d/0B3xY9FMzjybzWUpzdmNmWlhwUmc/view?usp=sharing 這是一個hackthon上面的資料,我只是想用實際一點的資料來做我正在研究的package train跟test都是數字資料是因為xgboost本身只吃數字資料,因此類別變數我全部都 轉成dummy variable,我用train data訓練一個random forest得到的RMSE在1179 但是我用相同的train data去訓練xgbooster然後predict,得到的RMSE居然2800多 已經是最後一名的邊都摸不到的那種,我覺得應該是我的code哪裡寫錯了,但是我看 vignette,我一開始是寫成classification的樣子,後來改成regression後卻跑出 負數的值,比用classification去跑更離譜,因此發文請教 xgboost(data = trainmatrix,label = train$Item_Outlet_Sales,max_depth=2 ,eta=1,nthread=2,nrounds = 2,objective="reg:linear",booster="gblinear")->s 上面是我用來訓練xgbooster的語法跟參數,我一開始跟著vignette寫如果booster不寫 =gblinear好像會試classfication,多寫以後跑出來是負數。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.175.245.91 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1468392521.A.C4F.html
文章代碼(AID): #1NXUH9nF (R_Language)