Re: [請益] 徵大數據課程心得

看板Soft_Job作者 (back-propagation)時間7年前 (2017/04/02 16:19), 7年前編輯推噓8(803)
留言11則, 10人參與, 最新討論串3/3 (看更多)
我目前從事資料科學相關工作, 時間分配上,扣除泡咖啡、開會、喇賽等等時間以後 95% Data mining(包含資料視覺化)、5% Machine Learning 以下是我的大數據課程心得: -- [機器學習 3學分] 最早在學校修這門課的時候,不知道需要什麼先備知識。 沒有機率、統計等基礎就傻傻跑去修, 線代只學過工程數學那些,而且還忘得差不多了... 結果,除了 k-mean 以外什麼都沒學到,所以就被當了。 -- 之後,我把田神的 HW0 拿來做, 想說:「寫出這些題目,應該就有捲土重來的本錢了吧...」 當時 HW0 都是找某位經濟系的同學請教才弄懂,給我看的都是五專會統科的課本。 我跟她說:「天啊妳有超有做AI的天分,只要會寫程式的話就超強惹!」 結果,她現在跑去綠地球當空姐。 -- [Pattern Recognition 3學分] 然後,我覺得自己應該準備好了,就去修這門課。 選課前,我還拿著 HW0 問老師:「懂這些夠嗎?」 修課以後學到特徵、資料正規化、訓練集、測試集,交叉驗證等等觀念, 才慢慢建立起比較完整的資料科學觀念輪廓。 雖然考數學題的時候,成績還是很慘烈, 但是老師要求我們在紙上一步步推演 Perceptron 的運作過程, 推演完以後有一點點"奇妙的"感覺,但我說不清楚是什麼。 為了弄清楚,為了讓這個感覺更強烈,我用C++自幹出一個 Perceptron, 搭配 OpenCV 把過程視覺化。 跑訓練的時候,看著自己寫的 Perceptron 不停移動, 真的慢慢把兩類 sample set 切得越來愈開。 我第一次感到自己寫的程式有智慧,真的會自己發現些什麼,那種感動是難以言喻的~ 這門課還有學到貝氏機率、kNN、SVM 等其他模型, 以及升維、降維等等一些入門的特徵處理手法。 -- 當時深度學習在台灣還沒紅,至少在台灣學界並不是廣為人知的。 TensorFlow 也還沒出來。 之後更進階的東西我大多數都是靠自修、或者和朋友同事討論, 就沒再上過這種正式的課程,但修了 Pattern Recognition 應該是把我帶入門的關鍵。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.53.142 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1491121154.A.C9F.html ※ 編輯: backprog (180.177.53.142), 04/02/2017 16:31:31

04/02 17:10, , 1F
讚讚讚
04/02 17:10, 1F

04/02 18:48, , 2F
推薦這篇文章。
04/02 18:48, 2F

04/02 18:59, , 3F
04/02 18:59, 3F

04/02 19:28, , 4F
一般來說資料視覺化大概佔了七八成的時間
04/02 19:28, 4F

04/02 19:28, , 5F
不然麻瓜會看不懂我們在做什麼
04/02 19:28, 5F
沒錯

04/02 19:39, , 6F
經濟系同學的圖呢?
04/02 19:39, 6F
在我深深的腦海中~~

04/02 20:01, , 7F
04/02 20:01, 7F

04/03 00:58, , 8F
羨慕不用做 data clean 和 etl
04/03 00:58, 8F
沒有不用,我只是把這兩樣當作 data mining 理所當然的一部分

04/03 00:59, , 9F
那你就視覺化啊
04/03 00:59, 9F

04/03 02:24, , 10F
HWO是什麼?
04/03 02:24, 10F
homework 0 ※ 編輯: backprog (125.227.205.43), 04/03/2017 12:17:28

04/04 19:17, , 11F
給一下樓上 林軒田 homework 0
04/04 19:17, 11F
文章代碼(AID): #1OuBG2oV (Soft_Job)
文章代碼(AID): #1OuBG2oV (Soft_Job)