Re: [閒聊] Machine Learning的出路已刪文
: → cckk3333:台大花了很多資源在比KDD CUP,軟體、硬體、人力資源都很 12/26 14:10
: → cckk3333:多,我猜其他隊伍沒有這麼多資源,所以我其實沒有覺得多 12/26 14:11
: → cckk3333:了不起 12/26 14:12
: → cckk3333:但畢竟可以接觸實務,也可以把整個流程學一遍,解決一些 12/26 14:12
: → cckk3333:問題,我覺得算是相當不錯的訓練 12/26 14:13
: → cckk3333:自己比過Kaggle知道就個人能力而言,離頂尖的人還有一段 12/26 14:13
: → cckk3333:差距 12/26 14:13
: 推 Murasaki0110:強 12/26 14:23
: 推 johnny94:想聽你分享參加 kaggle 的心得XD 12/27 15:57
聽到 Kaggle 有這麼好玩的東西,小弟不才玩了一個禮拜左右。
先說一下背景:數學研究所畢業,但學的是純數學,machine learning 知識接近零。
切入正題,這是目前有的比賽,http://www.kaggle.com/competitions
剛開始絕對不要越級打怪,初期累積 machine learning 知識為主,
decision tree 什麼基本的至少要會,很辛苦的看完一堆投影片,
開始選題目來玩。一開始建議選:
(1) Digit Recognizer
(2) Titanic: Machine Learning from Disaster
(3) Data Science London + Scikit-learn
因為是新手所以沒什麼壓力,有些 data files 內含 benchmark source code,
抓回來研究就可以了,有感覺之後,開始深入研究 classifer 是什麼,
以小弟來說,完全沒聽過 random forest, knn, svm 有聽但沒懂。
(可能需要一些 python / R 的經驗)
初期先求 submit prediction 成功,中期打敗 benchmark,
後期想辦法提升排名,排名會反映知識累積的結果,不計結果,
過程也能學到不少東西,至少我知道資料進 svm 之前要 normalization,
影像類的資料可以 preprocessing。
名次停滯不是系統有問題,而是自己技不如人,技不如人只好想點辦法進步,
然後改進,接著看名次往上爬,超爽DER!!!
其實國外這些資源真的很多,質量也不錯,有時間真的可以好好利用。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 111.241.33.168
推
01/07 23:11, , 1F
01/07 23:11, 1F
推
01/07 23:16, , 2F
01/07 23:16, 2F
→
01/08 01:25, , 3F
01/08 01:25, 3F
→
01/08 12:07, , 4F
01/08 12:07, 4F
推
01/08 15:52, , 5F
01/08 15:52, 5F
→
01/08 15:53, , 6F
01/08 15:53, 6F
→
01/08 15:53, , 7F
01/08 15:53, 7F
→
01/08 15:54, , 8F
01/08 15:54, 8F
→
01/08 15:54, , 9F
01/08 15:54, 9F
→
01/08 15:55, , 10F
01/08 15:55, 10F
→
01/08 21:27, , 11F
01/08 21:27, 11F
→
01/08 21:28, , 12F
01/08 21:28, 12F
推
01/08 21:32, , 13F
01/08 21:32, 13F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 4 之 4 篇):