Fw: [請益] 值得花十萬到巨匠 學大數據軟體嗎?

看板R_Language作者 (cywhale)時間7年前 (2016/12/27 13:23), 7年前編輯推噓5(5020)
留言25則, 7人參與, 最新討論串1/1
※ [本文轉錄自 Soft_Job 看板 #1ONrR3BY ] 作者: Wush978 (拒看低質媒體) 看板: Soft_Job 標題: Re: [請益] 值得花十萬到巨匠 學大數據軟體嗎? 時間: Sun Dec 25 13:18:56 2016 ※ 引述《s00771book (320)》之銘言: : 想問問前輩們 : 目前小妹的工作只是個 : 用BI cognos 拉資料做數據分析的助理 : 再用Excel樞紐分析 寫寫函數 : 做報告給主管看的工作 : 薪水少之又少 也不算是一技之長 : 根本不足以與大數據相提並論 : 目前嚮往大數據工作的方向 : (也是很有未來的工作 大陸已經很成熟了) : 查看了104人力銀行 : 大數據分析工作需要的條件: : MS SQL 資料探勘 R語言 Hedoop : 所以我去巨匠諮詢了一下 : 課程規劃師說要學 MCSA MCSE : 再考微軟證照70-461.462.463.464.465 : 才算是完全學會這套軟體 : 和證明給面試官看 : 但是學費竟然快要十萬 : 想請問有在做這方面工作的朋友們 : 真的值得花這筆錢嗎? : P.S.我只是個國立科大 企管+金融的學士而已 : 沒有漂亮的學歷 只能學一技之長補足自己 : 也不是資工 資管的科系的 : 希望前輩們能給我建議 謝謝你們>////< 如果要走數據分析(抱歉,我不太喜歡用大數據這個詞)的話, 從學R 入門也是一個方法。 資料科學有三個要素:programming, statistics, domain knowledge 我自己在台灣的職涯差不多是: 有programming --> 薪資為 n 有programming + statistics ( 差不多是 machine learning ) --> 2n 有programming + statistics + domain knowledge --> 4n 你目前已經在工作了,只要花心思就可以開始累積domain knowledge: 你們領域中在意的問題是什麼?哪些方向?各種問題的價值?... etc Programming的話坊間已經有很多自學教材了。 我這邊推薦我與社群做的: R語言翻轉教室 http://datascienceandr.org 你可以自由的使用它做自學R 語言,大概會花你12-18小時。 教材中我自認寫的最滿意的是Data Engineer的那段, 感謝社群朋友的捐獻,拿一個利用Open Data計算房地產泡沫化指數的小專案當成作業 因為原始資料完全沒有清理,所以這個作業差不多是一個期末報告的難度 但是它非常的貼近實際做資料科學與Open Data相關工作的情境。 這個教材對沒有程式基礎的同學比較挑戰, 有問題,網頁的右下角有聊天室可以問我, 或是你也可以考慮先使用其他教材。 台灣的R社群中還有: - ptt R_Language版的板主:andrew 的「R 演習室」 http://apansharing.blogspot.tw/p/r.html - Tony Yao-Jen Kuo 與 Data Camp合作的教材: https://goo.gl/KxjhIq 這套與R語言翻轉教室很類似,差異在: - 是不用搞安裝環境,想嘗試可以更快開始嘗試 - 課程內容差不多是R語言翻轉教室RBasic的範疇,但是難度應該對新手更友善 (我最近正計畫要降低R語言翻轉教室的難度 ...) R還有非常多其他的線上自學資源,族繁不及備載 其實你也不一定要學R, python 也是和R 一樣好的分析工具,網路上也可以找到很多 自學資源 我覺得你「能不能運用自學資源自學工具」其實是衡量自己Programming能力的指標。 如果不能的話,就先好好學一套工具,基本上就具備這個能力了。 最後分析的能力,我覺得這是自學比較難補充的部份。 如果數學夠好,就去啃書本吧。 另一種作法,是去分析的單位做Data Engineer,或是做研究助理,然後一邊工作一邊學 但是最好還是去補個與你想投入領域相關的碩士學位。 因為分析這種事情,很看個人的信譽、聲望,而且也離不開domain knowledge。 好的人做的分析報告,大家直接跳到結論。不好的人,就算你該做的都做了也沒人信。 要走這條路,一輩子也都要學習,共勉之。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.163.178.87 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1482643139.A.2E2.html

12/25 13:22, , 1F
終於有人點出大數據不等於資料科學,
12/25 13:22, 1F

12/25 13:22, , 2F
我超覺得一直強調大數據根本有事一一...
12/25 13:22, 2F
大數據是個定義不明確的詞彙,所以要介紹怎麼學大數據, 問100個人大概會有25個說法,然後就戰了。 相對來說,資料科學是比較定義明確的詞彙, 從公認的三個要素(programming, statistics, domain knowledge)分開來介紹, 也是比較好寫的。

12/25 13:26, , 3F
比較像統計工程?
12/25 13:26, 3F

12/25 13:39, , 4F
2n挺吸引人的 ,4n也是
12/25 13:39, 4F

12/25 13:41, , 5F
12/25 13:41, 5F
※ 編輯: Wush978 (1.163.178.87), 12/25/2016 13:58:00

12/25 15:04, , 6F
推推
12/25 15:04, 6F

12/25 15:19, , 7F
吳大文必推 用過他的翻轉教室課程 很厲害!!
12/25 15:19, 7F

12/25 15:21, , 8F
推學長! ....HW6還沒做完><
12/25 15:21, 8F

12/25 16:15, , 9F
wush大就是帥
12/25 16:15, 9F

12/25 17:09, , 10F
推推
12/25 17:09, 10F

12/25 18:01, , 11F
所以N是多少呢?
12/25 18:01, 11F

12/25 18:27, , 12F
朝聖推
12/25 18:27, 12F

12/25 21:43, , 13F
釣出神人
12/25 21:43, 13F

12/25 21:57, , 14F
看到WUSH只好推了
12/25 21:57, 14F

12/25 22:24, , 15F
推,資料科學
12/25 22:24, 15F

12/26 02:14, , 16F
到底哪裡有開放的data可以讓人學大數據
12/26 02:14, 16F

12/26 06:25, , 17F
開放政府
12/26 06:25, 17F

12/26 07:38, , 18F
感謝分享
12/26 07:38, 18F

12/26 08:06, , 19F
12/26 08:06, 19F

12/26 12:26, , 20F
推Wish大大
12/26 12:26, 20F

12/26 23:31, , 21F
推 wush
12/26 23:31, 21F

12/27 00:57, , 22F
朝聖 Wush <(_ _)>
12/27 00:57, 22F

12/27 08:35, , 23F
推推推
12/27 08:35, 23F

12/27 12:31, , 24F
推Wush大~
12/27 12:31, 24F

12/27 12:35, , 25F
另推一篇翟本喬https://goo.gl/mLHMdS不要奢望程式速成班
12/27 12:35, 25F
※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: cywhale (140.112.65.48), 12/27/2016 13:23:27

12/27 13:26, , 26F
推一下Wush大在soft job版發的文~(應不用修前面推文吧~
12/27 13:26, 26F

12/27 13:55, , 27F
其實我只是想繼續推教材啦,哈哈哈
12/27 13:55, 27F

12/27 13:55, , 28F
這邊已經有置底了
12/27 13:55, 28F

12/27 17:48, , 29F
請問,學machine learning,需要自己寫演算法嗎?
12/27 17:48, 29F

12/27 21:28, , 30F
你問的演算法是那個層次的演算法?
12/27 21:28, 30F

12/28 00:21, , 31F
因為我目前都是用其他人寫好的packages
12/28 00:21, 31F

12/28 00:22, , 32F
未來工作 , 不知道需不需要 , 自己寫ML
12/28 00:22, 32F

12/28 00:58, , 33F
如果是一般的情況,可能不用自己會寫算法
12/28 00:58, 33F

12/28 00:58, , 34F
我的情況是資料量大,一般ML套件都不能用,所以要自己能
12/28 00:58, 34F

12/28 00:59, , 35F
寫才能跑得動
12/28 00:59, 35F

12/28 00:59, , 36F
如果一般套件能跑出好結果的話,我也傾向用一般套件先做
12/28 00:59, 36F

12/28 00:59, , 37F
兩種工作內容(找精準的算法、寫算法)在大公司可能是分
12/28 00:59, 37F

12/28 00:59, , 38F
開的職位或部門
12/28 00:59, 38F

12/28 11:29, , 39F
感謝
12/28 11:29, 39F

12/29 08:53, , 40F
實在不想說~~ 有些公司要找神人 會資料庫、分析、演算法
12/29 08:53, 40F

12/29 08:53, , 41F
開那種爛價格~~ 農曆年我會整理一下這些公司資訊
12/29 08:53, 41F

12/29 10:01, , 42F
想請問wush大,什麼樣的定義叫做資料大呢
12/29 10:01, 42F

12/29 10:01, , 43F
而為什麼自己寫的跟library裡面的速度上會有差異
12/29 10:01, 43F

12/29 10:02, , 44F
作者應該也有考量過這些問題吧,我目前跑起來在e1071
12/29 10:02, 44F

12/29 10:02, , 45F
裡面的svm速度確實不是很理想,這跟library本身有關嗎
12/29 10:02, 45F

12/29 20:26, , 46F
svm超級慢 幾萬筆就掛了
12/29 20:26, 46F

12/29 20:27, , 47F
library有些是用 c++ 寫 當然快很多 R很慢的
12/29 20:27, 47F

12/29 20:28, , 48F
推薦你用xgboost 比svm快很多 吃的ram也小
12/29 20:28, 48F

12/29 20:28, , 49F
還可以CPU全開去跑
12/29 20:28, 49F

03/18 02:02, , 50F
翟本喬:不要奢望程式速成班 https://goo.gl/mLHMdS
03/18 02:02, 50F
文章代碼(AID): #1OOVhH_Q (R_Language)