[心得] 資料科學家工作分享與 AI 產業觀察
最近版上好像很多人對 AI, ML, Data mining 的工作有興趣
也想知道自學, 唸碩士, AIA 或其他方式怎麼能夠進入 AI 產業
我自己就是資料科學家
想跟大家分享一下我的工作內容跟對 AI 產業的觀察
=== 先說結論 ===
1. 非CS背景想轉職 AI => 念四大碩,主修 AI
2. 不想念碩士,想自學
=> 證明你比四大碩強 => 去社群給 Talk or Kaggle 比到前三
社群有 ML/DM Monday, Taipei.py, Py data 等等
有個聽眾覺得『哎唷不錯喔』,機會就來了
3. 已經是資工碩了
=> 去社群給 Talk or 發top conference paper ex: AAAI, NAACL
=== 我的背景 ===
台大資工學碩
主修NLP, 熟AI, ML, SVM, 不熟DL
待過趨勢,華碩,新創
六年工作經驗 四年DS經驗, 英語流利
=== 資料相關工作內容 ===
資料分析師 : 有產業, 統計知識, 了解問題, 把問題變成數學問題
資料科學家: 把問題變成數學問題, 抽feature, 訂evaluation
設計數學演算法, 寫prototype
資料工程師:data clean, data storage, big data, cloud computing
機器學習工程師:設計數學演算法, 實作演算法, 挑ML模型, tune 參數
把prototype 改成 production code
通常在台灣就是四種都要做...統稱資料科學家
根據背景知識, data type還會細分成
影像CV, 語音, 語言NLP, 產線資料, signal, 地理資訊等等
影像現在在台灣最紅,約有60家新創
NLP 約20家
語音約3家, google/apple/ms 太強,很難跟他們競爭
後面三種data 我沒有研究....
=== AI 產業現況 ===
2012 - 2017 爆紅 超火
2018 冷靜重整期,很多 AI 新創倒閉
2019 假AI新創很多, Junior 飽和, Senior 超缺
Senior 假設台灣有 N 個,可是缺有 4N
大家都要即戰力,有經驗的,可以馬上做專案
但是Sr. 不是去美國,就是不想換工作
如果你是即戰力,我手上有10個缺可以介紹
Junior 有 N 個,缺大概也有 1.2N 個
不過台灣每年生產1000個 AI碩士吧,所以也不缺人
假 AI 新創就是 『口號出得去 人進得來 大家大發財』
去面試就知道老闆不懂 AI ,問一下雷公司八卦都很多
另外開了2, 3年沒有產品也沒有賺錢的大概也怪怪的
=== 關於訓練新人 ===
公司訓練 Jr 是需要花錢花時間的
而且我的經驗是專案都做不完,哪有時間訓練新人?
讓Sr. 花 20% 的時間訓練新人,少做 20% 專案老闆願意媽?
Sr. 願意犧牲看八卦版呵呵笑的時間訓練新人,是我佛心來著
但是很多新人訓練好又去美國或念博班
我也很無奈呀...
去美國的工作環境, 工時, 薪水, 技術都好很多
念博班的說他想做世界第一,不想做客戶願意付錢的東西
=== 結論 ===
我覺得不鼓勵大家轉職 AI
好公司大概都飽和了,只收 AI 碩
2017年前 AI 景氣很好,但是現在冷了
假AI新創又多,有70%吧,如果你沒有能力分辨就是當砲灰
AIOT 現在 90% 是假新創
另外當資料科學家
背景知識,工程,數學,英文都是基本能力唷
很多人說數學很重要...是因為他們工程跟英文都很好了
Pycon Taiwan 徵稿中 3/18截止,當過講者求職大加分喔!
--
Q:為什麼aacs叫小西呢??
A:1.因為aacs的英文名字叫Cicilia Segeliin
2.因為西是最好寫的C
3.西是由一條拋物線+一組雙曲線+一個橢圓組成的
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.134.185.153
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1551945907.A.F59.html
推
03/07 16:11,
6年前
, 1F
03/07 16:11, 1F
→
03/07 16:13,
6年前
, 2F
03/07 16:13, 2F
→
03/07 16:14,
6年前
, 3F
03/07 16:14, 3F
cloud computing, AI, IOT, 區塊鏈, FinTech, Deep learning, AIOT
一波炒過一波
當菜市場阿嬤都知道AI,股市都有AI概念股,就代表潮水要退了
→
03/07 16:18,
6年前
, 4F
03/07 16:18, 4F
→
03/07 16:18,
6年前
, 5F
03/07 16:18, 5F
→
03/07 16:19,
6年前
, 6F
03/07 16:19, 6F
→
03/07 16:19,
6年前
, 7F
03/07 16:19, 7F
→
03/07 16:19,
6年前
, 8F
03/07 16:19, 8F
→
03/07 16:21,
6年前
, 9F
03/07 16:21, 9F
→
03/07 16:21,
6年前
, 10F
03/07 16:21, 10F
→
03/07 16:22,
6年前
, 11F
03/07 16:22, 11F
→
03/07 16:23,
6年前
, 12F
03/07 16:23, 12F
補充說明:
轉職難民太多,但是他們都沒有作品跟成果...
每個都說我很便宜,請訓練我。
但是我有時間為什麼不去訓練台大碩,要訓練你呢?
推
03/07 16:27,
6年前
, 13F
03/07 16:27, 13F
→
03/07 16:27,
6年前
, 14F
03/07 16:27, 14F
推
03/07 16:27,
6年前
, 15F
03/07 16:27, 15F
→
03/07 16:30,
6年前
, 16F
03/07 16:30, 16F
→
03/07 16:30,
6年前
, 17F
03/07 16:30, 17F
→
03/07 16:33,
6年前
, 18F
03/07 16:33, 18F
→
03/07 16:45,
6年前
, 19F
03/07 16:45, 19F
現在景氣不好,多聊十家吧!
推
03/07 16:58,
6年前
, 20F
03/07 16:58, 20F
華碩不錯啊,學習到很多東西。
我知道自己要什麼,缺什麼就好囉~~~
台大純血沒去美國就會一直被罵耶~~~
推
03/07 16:58,
6年前
, 21F
03/07 16:58, 21F
推
03/07 17:03,
6年前
, 22F
03/07 17:03, 22F
推
03/07 17:33,
6年前
, 23F
03/07 17:33, 23F
老實說我覺得這是台灣 AI 圈的困境
一來 AI 圈也才紅5年,Sr. 本來就不多
二來 很多 Sr. 都跑去美國了
三來 Jr. 沒人帶也沒有自學能力就不能變Sr.,只會變成Super Junior
四來 老闆都希望Sr. 免費加班帶Jr. 還要加班做專案
→
03/07 17:34,
6年前
, 24F
03/07 17:34, 24F
→
03/07 17:37,
6年前
, 25F
03/07 17:37, 25F
推
03/07 17:49,
6年前
, 26F
03/07 17:49, 26F
會被告耶
推
03/07 17:56,
6年前
, 27F
03/07 17:56, 27F
推
03/07 18:01,
6年前
, 28F
03/07 18:01, 28F
推
03/07 18:02,
6年前
, 29F
03/07 18:02, 29F
→
03/07 18:02,
6年前
, 30F
03/07 18:02, 30F
推
03/07 18:03,
6年前
, 31F
03/07 18:03, 31F
推
03/07 18:23,
6年前
, 32F
03/07 18:23, 32F
推
03/07 18:45,
6年前
, 33F
03/07 18:45, 33F
還有 67 則推文
還有 16 段內文
推
03/09 00:20,
6年前
, 101F
03/09 00:20, 101F
→
03/09 00:21,
6年前
, 102F
03/09 00:21, 102F
→
03/09 00:31,
6年前
, 103F
03/09 00:31, 103F
→
03/09 00:31,
6年前
, 104F
03/09 00:31, 104F
我不是高手啦,但是台灣都是一個人包DS, DA, Data Eng, ML Eng
但是名稱掛資料科學家
每次講自己的職稱都覺得很心虛,只有使用者經驗研究員聽起來更威
→
03/09 00:33,
6年前
, 105F
03/09 00:33, 105F
→
03/09 00:34,
6年前
, 106F
03/09 00:34, 106F
→
03/09 00:34,
6年前
, 107F
03/09 00:34, 107F
→
03/09 00:34,
6年前
, 108F
03/09 00:34, 108F
→
03/09 00:35,
6年前
, 109F
03/09 00:35, 109F
推
03/09 00:48,
6年前
, 110F
03/09 00:48, 110F
→
03/09 00:58,
6年前
, 111F
03/09 00:58, 111F
→
03/09 01:29,
6年前
, 112F
03/09 01:29, 112F
推
03/09 02:05,
6年前
, 113F
03/09 02:05, 113F
→
03/09 02:06,
6年前
, 114F
03/09 02:06, 114F
→
03/09 02:09,
6年前
, 115F
03/09 02:09, 115F
推
03/09 02:21,
6年前
, 116F
03/09 02:21, 116F
→
03/09 02:21,
6年前
, 117F
03/09 02:21, 117F
→
03/09 02:28,
6年前
, 118F
03/09 02:28, 118F
→
03/09 02:28,
6年前
, 119F
03/09 02:28, 119F
樓上大大們有的說的是美國大公司的純資料科學家
有的說的是台灣包山包海的資料科學家,很多沒有設計模型跟演算法
美國大公司的純資料科學家有個配合的工程師
幫忙把prototype 改寫成 production code
所以不必資工本科,很多統計,數學,工科博士背景
不過台灣prototype直接要上線的就很需要軟體工程背景了
因為上線交給客戶後有 bug 超麻煩
→
03/09 02:51,
6年前
, 120F
03/09 02:51, 120F
→
03/09 02:52,
6年前
, 121F
03/09 02:52, 121F
→
03/09 02:52,
6年前
, 122F
03/09 02:52, 122F
→
03/09 02:57,
6年前
, 123F
03/09 02:57, 123F
※ 編輯: aacs0130 (123.193.91.113), 03/09/2019 03:08:13
推
03/09 04:45,
6年前
, 124F
03/09 04:45, 124F
→
03/09 04:45,
6年前
, 125F
03/09 04:45, 125F
推
03/09 07:11,
6年前
, 126F
03/09 07:11, 126F
推
03/09 08:06,
6年前
, 127F
03/09 08:06, 127F
→
03/09 08:06,
6年前
, 128F
03/09 08:06, 128F
→
03/09 08:06,
6年前
, 129F
03/09 08:06, 129F
推
03/09 08:17,
6年前
, 130F
03/09 08:17, 130F
推
03/09 13:13,
6年前
, 131F
03/09 13:13, 131F
→
03/09 13:15,
6年前
, 132F
03/09 13:15, 132F
→
03/09 13:15,
6年前
, 133F
03/09 13:15, 133F
推
03/09 14:22,
6年前
, 134F
03/09 14:22, 134F
推
03/09 23:44,
6年前
, 135F
03/09 23:44, 135F
推
03/10 12:30,
6年前
, 136F
03/10 12:30, 136F
推
03/12 09:45,
6年前
, 137F
03/12 09:45, 137F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):