Fw: [請益] 值得花十萬到巨匠 學大數據軟體嗎?
※ [本文轉錄自 Soft_Job 看板 #1ONrR3BY ]
作者: Wush978 (拒看低質媒體) 看板: Soft_Job
標題: Re: [請益] 值得花十萬到巨匠 學大數據軟體嗎?
時間: Sun Dec 25 13:18:56 2016
※ 引述《s00771book (320)》之銘言:
: 想問問前輩們
: 目前小妹的工作只是個
: 用BI cognos 拉資料做數據分析的助理
: 再用Excel樞紐分析 寫寫函數
: 做報告給主管看的工作
: 薪水少之又少 也不算是一技之長
: 根本不足以與大數據相提並論
: 目前嚮往大數據工作的方向
: (也是很有未來的工作 大陸已經很成熟了)
: 查看了104人力銀行
: 大數據分析工作需要的條件:
: MS SQL 資料探勘 R語言 Hedoop
: 所以我去巨匠諮詢了一下
: 課程規劃師說要學 MCSA MCSE
: 再考微軟證照70-461.462.463.464.465
: 才算是完全學會這套軟體
: 和證明給面試官看
: 但是學費竟然快要十萬
: 想請問有在做這方面工作的朋友們
: 真的值得花這筆錢嗎?
: P.S.我只是個國立科大 企管+金融的學士而已
: 沒有漂亮的學歷 只能學一技之長補足自己
: 也不是資工 資管的科系的
: 希望前輩們能給我建議 謝謝你們>////<
如果要走數據分析(抱歉,我不太喜歡用大數據這個詞)的話,
從學R 入門也是一個方法。
資料科學有三個要素:programming, statistics, domain knowledge
我自己在台灣的職涯差不多是:
有programming --> 薪資為 n
有programming + statistics ( 差不多是 machine learning ) --> 2n
有programming + statistics + domain knowledge --> 4n
你目前已經在工作了,只要花心思就可以開始累積domain knowledge:
你們領域中在意的問題是什麼?哪些方向?各種問題的價值?... etc
Programming的話坊間已經有很多自學教材了。
我這邊推薦我與社群做的: R語言翻轉教室 http://datascienceandr.org
你可以自由的使用它做自學R 語言,大概會花你12-18小時。
教材中我自認寫的最滿意的是Data Engineer的那段,
感謝社群朋友的捐獻,拿一個利用Open Data計算房地產泡沫化指數的小專案當成作業
因為原始資料完全沒有清理,所以這個作業差不多是一個期末報告的難度
但是它非常的貼近實際做資料科學與Open Data相關工作的情境。
這個教材對沒有程式基礎的同學比較挑戰,
有問題,網頁的右下角有聊天室可以問我,
或是你也可以考慮先使用其他教材。
台灣的R社群中還有:
- ptt R_Language版的板主:andrew 的「R 演習室」
http://apansharing.blogspot.tw/p/r.html
- Tony Yao-Jen Kuo 與 Data Camp合作的教材: https://goo.gl/KxjhIq
這套與R語言翻轉教室很類似,差異在:
- 是不用搞安裝環境,想嘗試可以更快開始嘗試
- 課程內容差不多是R語言翻轉教室RBasic的範疇,但是難度應該對新手更友善
(我最近正計畫要降低R語言翻轉教室的難度 ...)
R還有非常多其他的線上自學資源,族繁不及備載
其實你也不一定要學R, python 也是和R 一樣好的分析工具,網路上也可以找到很多
自學資源
我覺得你「能不能運用自學資源自學工具」其實是衡量自己Programming能力的指標。
如果不能的話,就先好好學一套工具,基本上就具備這個能力了。
最後分析的能力,我覺得這是自學比較難補充的部份。
如果數學夠好,就去啃書本吧。
另一種作法,是去分析的單位做Data Engineer,或是做研究助理,然後一邊工作一邊學
但是最好還是去補個與你想投入領域相關的碩士學位。
因為分析這種事情,很看個人的信譽、聲望,而且也離不開domain knowledge。
好的人做的分析報告,大家直接跳到結論。不好的人,就算你該做的都做了也沒人信。
要走這條路,一輩子也都要學習,共勉之。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.163.178.87
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1482643139.A.2E2.html
→
12/25 13:22, , 1F
12/25 13:22, 1F
→
12/25 13:22, , 2F
12/25 13:22, 2F
大數據是個定義不明確的詞彙,所以要介紹怎麼學大數據,
問100個人大概會有25個說法,然後就戰了。
相對來說,資料科學是比較定義明確的詞彙,
從公認的三個要素(programming, statistics, domain knowledge)分開來介紹,
也是比較好寫的。
→
12/25 13:26, , 3F
12/25 13:26, 3F
推
12/25 13:39, , 4F
12/25 13:39, 4F
推
12/25 13:41, , 5F
12/25 13:41, 5F
※ 編輯: Wush978 (1.163.178.87), 12/25/2016 13:58:00
推
12/25 15:04, , 6F
12/25 15:04, 6F
推
12/25 15:19, , 7F
12/25 15:19, 7F
推
12/25 15:21, , 8F
12/25 15:21, 8F
推
12/25 16:15, , 9F
12/25 16:15, 9F
推
12/25 17:09, , 10F
12/25 17:09, 10F
推
12/25 18:01, , 11F
12/25 18:01, 11F
推
12/25 18:27, , 12F
12/25 18:27, 12F
推
12/25 21:43, , 13F
12/25 21:43, 13F
推
12/25 21:57, , 14F
12/25 21:57, 14F
推
12/25 22:24, , 15F
12/25 22:24, 15F
推
12/26 02:14, , 16F
12/26 02:14, 16F
→
12/26 06:25, , 17F
12/26 06:25, 17F
→
12/26 07:38, , 18F
12/26 07:38, 18F
推
12/26 08:06, , 19F
12/26 08:06, 19F
推
12/26 12:26, , 20F
12/26 12:26, 20F
推
12/26 23:31, , 21F
12/26 23:31, 21F
推
12/27 00:57, , 22F
12/27 00:57, 22F
推
12/27 08:35, , 23F
12/27 08:35, 23F
推
12/27 12:31, , 24F
12/27 12:31, 24F
推
12/27 12:35, , 25F
12/27 12:35, 25F
※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: cywhale (140.112.65.48), 12/27/2016 13:23:27
→
12/27 13:26, , 26F
12/27 13:26, 26F
→
12/27 13:55, , 27F
12/27 13:55, 27F
→
12/27 13:55, , 28F
12/27 13:55, 28F
→
12/27 17:48, , 29F
12/27 17:48, 29F
→
12/27 21:28, , 30F
12/27 21:28, 30F
推
12/28 00:21, , 31F
12/28 00:21, 31F
→
12/28 00:22, , 32F
12/28 00:22, 32F
→
12/28 00:58, , 33F
12/28 00:58, 33F
→
12/28 00:58, , 34F
12/28 00:58, 34F
→
12/28 00:59, , 35F
12/28 00:59, 35F
→
12/28 00:59, , 36F
12/28 00:59, 36F
→
12/28 00:59, , 37F
12/28 00:59, 37F
→
12/28 00:59, , 38F
12/28 00:59, 38F
推
12/28 11:29, , 39F
12/28 11:29, 39F
推
12/29 08:53, , 40F
12/29 08:53, 40F
→
12/29 08:53, , 41F
12/29 08:53, 41F
→
12/29 10:01, , 42F
12/29 10:01, 42F
→
12/29 10:01, , 43F
12/29 10:01, 43F
→
12/29 10:02, , 44F
12/29 10:02, 44F
→
12/29 10:02, , 45F
12/29 10:02, 45F
推
12/29 20:26, , 46F
12/29 20:26, 46F
→
12/29 20:27, , 47F
12/29 20:27, 47F
→
12/29 20:28, , 48F
12/29 20:28, 48F
→
12/29 20:28, , 49F
12/29 20:28, 49F
推
03/18 02:02, , 50F
03/18 02:02, 50F