[問題] xgboost同原始資料當input，先經過轉換?

看板DataScience作者woogee (woogee)時間6年前發表 (2019/04/28 10:19), 6年前編輯推噓8(8推 0噓 22→)

留言30則, 6人參與, 6年前最新討論串1/1

不好意思，這個問題實在不知道怎麼下標題所以只好這樣下是這樣的，最近有個project有點趕內容比較不方便說明，這邊用舉例的舉例為：假設你目前僅有的資料是身高和體重要預測他會喜歡4種商品的哪樣產品(multi class classification) 我的疑問為：直接以"身高、體重"當input，使用xgboost預測與先以常用的已知公式bmi計算後再把"身高、體重、bmi"使用xgboost預測是否可能會增加正確率? 會有這個疑問是因為bmi原本也是從身高、體重所衍生的資訊如果原本身高體重就無法解釋喜歡哪樣商品縱使增加了bmi這個資訊正確率仍然不會增加才對但概念上，先計算出bmi與資料預處理(preprocessing)又有點類似好的預處理確實會影響預測準確率所以到底先經過一些原本已知的公式計算後當input，有沒有可能大幅增加正確率? 以上，先謝謝各位大大的指教 == 補充：因為時間比較緊，我只能在 1. 撰寫一堆爬蟲趕快搜集蒐集更多資料 2. 撰寫一推不同的公式計算當input預測看看兩個方式抉擇一種又2的部分也有將近無限多種公式的種類所以如果2的方式確定不可行，或是可行的機會太渺茫我要把時間全部砸在1的方式處理以上，謝謝各位 --

推

→

推

推

-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.171.175.207 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1556446774.A.ADD.html ※ 編輯: woogee (1.171.175.207), 04/28/2019 18:27:44

推

ruokcnn

04/28 19:46, 6年前 , 1^F

04/28 19:46, 1^F

→

ruokcnn

04/28 19:47, 6年前 , 2^F

04/28 19:47, 2^F

→

ruokcnn

04/28 19:47, 6年前 , 3^F

04/28 19:47, 3^F