作者查詢 / vfgce

總覽項目: 發文 | 留言 | 暱稱
作者 vfgce 在 PTT [ DataScience ] 看板的留言(推文), 共18則
限定看板:DataScience
首頁
上一頁
1
下一頁
尾頁
[轉錄] [閒聊] 菜鳥上Kaggle: 房價預測 1
[ DataScience ]17 留言, 推噓總分: +5
作者: aaaba - 發表於 2018/03/10 08:46(7年前)
3Fvfgce: kaggle的測試集,通常不附target..沒辦法用cross-validation03/07 07:30
4Fvfgce: emsemble learning通常也沒有比單一模型好很多..03/07 07:32
5Fvfgce: pandas真的要好好學,但sklearn最大問題在於對類別屬性的03/07 07:37
6Fvfgce: 處理不佳.03/07 07:37
7Fvfgce: pandas已經有category,但sklearn還無法使用03/07 07:39
8Fvfgce: 目前只有Y能夠以分類處理,X的部分都轉成int,然後被轉成03/07 07:42
11Fvfgce: flaot去處理了.這是頗不合理的處理方式....03/07 07:44
12Fvfgce: 用過R的大概知道我說的是什麼..這部分希望sklearn能否直接03/07 07:45
13Fvfgce: 支援pandas就方便多了.03/07 07:45
21Fvfgce: 所以你有一堆數值和類別混合的data,用python做真的會想XXX03/07 17:07
22Fvfgce: R內建有factor類別,套件也多能配合,用起來方便多了.03/07 17:08
23Fvfgce: 明明sklearn是一個豐富的PACKAGE,當初怎沒將這個考慮進去.03/07 17:21
24Fvfgce: 用上決策樹的感受特別明顯.03/07 17:23
25Fvfgce: ONE HOT 也不是萬靈丹,當屬性含有很多類別時,會製造出更多03/07 17:25
26Fvfgce: 屬性,整個屬性維度又更大.03/07 17:29
27Fvfgce: R內建的FACOTR,套件大多考慮到這一層,用起來方便多了.03/07 17:31
28Fvfgce: 或許SKLEARN 只考慮到配合NUMPY使用,但這問題應該還多人都03/07 17:32
29Fvfgce: 遇到了. 希望後面的版正能修正這個問題...03/07 17:33
首頁
上一頁
1
下一頁
尾頁