作者查詢 / vfgce
作者 vfgce 在 PTT [ DataScience ] 看板的留言(推文), 共18則
限定看板:DataScience
看板排序:
全部Gossiping2575Spurs722historia612DummyHistory472NBA359medstudent331Python235Guardians220Stock180Soft_Job149medache117HatePolitics70politics49Baseball36R_Language33Policy28KMT25DataScience18CrossStrait15home-sale13CareerPlan11gallantry10JapanHistory8PublicIssue8Dragons6emprisenovel5Future-Star5L_TalkandCha5SAN5CMWang4Health3TW-history3ASM2BabyBears2GuardRookies2Prob_Solve2AfterPhD1BLAZERS1CFP1Eng-Class1Hualien1java1L_LifeJob1Militarylife1<< 收起看板(44)
首頁
上一頁
1
下一頁
尾頁
3F推: kaggle的測試集,通常不附target..沒辦法用cross-validation03/07 07:30
4F→: emsemble learning通常也沒有比單一模型好很多..03/07 07:32
5F推: pandas真的要好好學,但sklearn最大問題在於對類別屬性的03/07 07:37
6F→: 處理不佳.03/07 07:37
7F→: pandas已經有category,但sklearn還無法使用03/07 07:39
8F→: 目前只有Y能夠以分類處理,X的部分都轉成int,然後被轉成03/07 07:42
11F→: flaot去處理了.這是頗不合理的處理方式....03/07 07:44
12F→: 用過R的大概知道我說的是什麼..這部分希望sklearn能否直接03/07 07:45
13F→: 支援pandas就方便多了.03/07 07:45
21F推: 所以你有一堆數值和類別混合的data,用python做真的會想XXX03/07 17:07
22F→: R內建有factor類別,套件也多能配合,用起來方便多了.03/07 17:08
23F推: 明明sklearn是一個豐富的PACKAGE,當初怎沒將這個考慮進去.03/07 17:21
24F推: 用上決策樹的感受特別明顯.03/07 17:23
25F→: ONE HOT 也不是萬靈丹,當屬性含有很多類別時,會製造出更多03/07 17:25
26F推: 屬性,整個屬性維度又更大.03/07 17:29
27F→: R內建的FACOTR,套件大多考慮到這一層,用起來方便多了.03/07 17:31
28F→: 或許SKLEARN 只考慮到配合NUMPY使用,但這問題應該還多人都03/07 17:32
29F→: 遇到了. 希望後面的版正能修正這個問題...03/07 17:33
首頁
上一頁
1
下一頁
尾頁