Re: [請益]資料分析/科學的工作是不是幾乎都要碩士..

看板Soft_Job作者時間8年前 (2018/02/09 00:54), 編輯推噓12(12020)
留言32則, 14人參與, 8年前最新討論串2/2 (看更多)
※ 引述《HWSH (光的夜生活)》之銘言: : 小弟去年從國立臺北大學統計系畢業 : 計畫先工作個兩三年再去申請國外研究所 : 目前即將服完兵役 本來是希望年後可以開始上班 : 最近幾天開始找工作 履歷卻一直被已讀 : 感到一點小小的「挫折」 : 看了一下應徵者狀況 六七成都是碩博 : 唉學歷拚不過別人真的是硬傷 : 真的沒有一些初階的資料科學家助理工作可以做做看嘛哈哈 : 我很樂意從Data Cleansing的工作做起 : 交代一下背景 : 大概是大三決定要走資料科學家這條路 : 接觸coding到現在大概兩年 : 最常用的是R跟SAS : 有去修資工的資結跟演算法 : 會一點C跟Matlab : 最近在看線上課程學python : 英文聽說讀寫沒問題 : SQL還真的完全沒碰過(滿多職缺都有要求) : Deep learning幾乎沒有頭緒(只知道ML) : Hadoop跟Spark只知道是在幹嘛的也沒有實際操作過 : 唉唉真的是太嫩了 : 想請版上的前輩大大們點一盞明燈提供一點建議 : 謝謝謝謝 用力鞭沒關係 身為這一塊的弱弱從業人員給你建議 我覺得你心態可能要改 資料科學家 70%以上的時間都在做data cleansing 但你好像搞錯狀況了 以為這種東西是初階的工作 但是實際上並不是這樣 實戰經驗上需要想辦法增進把資料清整時間到可以拿去建模 在台灣 有意願想做這方面的公司在過去對於資料的管理上都很不嚴謹 你看到的會是雜亂無章又一堆莫名其妙的資料 光是處理資料encoding的問題就夠你燒腦燒時間的 更別說還有一堆雜事 如果你以為資料科學家只要爽爽地建模就好了那真的是太天真了 加上從你內文中沒接觸過SQL 沒玩過Deep learning 好像也不會爬蟲 資料視覺化的工具也沒提到會不會 ML到底接觸多深也不知道 要走資料這塊只會R卻不會python 也是硬傷 勸你先去了解一下R和Python彼此的優缺點 另外有沒有實際上玩過什麼專案也看不出來 講白了如果我部門開缺你來應徵 我還真不知道有什麼誘因讓你進來一同工作 有個建議是如果真的想增進實力 上去Kaggle看看其他人在幹嘛 同樣的dataset你能不能做出跟人家一樣的結果 或是去挑個競賽區的試試看自己做出來的結果到哪 另外就是最近吹很大的各種相關“前景”請審慎看待不要一頭熱 有時候實務面上跟這些投機客炒作的泡泡還是有不小的落差 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.121.188 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1518108879.A.FB1.html

02/09 01:56, 8年前 , 1F
推這篇
02/09 01:56, 1F

02/09 02:13, 8年前 , 2F
推推
02/09 02:13, 2F

02/09 02:54, 8年前 , 3F
10-15年前,大家都在跟風玩data warehousing 炒作data min
02/09 02:54, 3F

02/09 02:54, 8年前 , 4F
ing種下的惡果啊,看過一堆奇葩系統各種沒建pk fk constra
02/09 02:54, 4F

02/09 02:54, 8年前 , 5F
ins,沒有正規化,各種垃圾資料狂塞猛送,然後現在抱著這
02/09 02:54, 5F

02/09 02:54, 8年前 , 6F
些資料要來玩AI。
02/09 02:54, 6F

02/09 08:52, 8年前 , 7F
嘴砲>>>>>>>狗屁ML+資料分析 不會嘴走這行是找死
02/09 08:52, 7F

02/09 09:40, 8年前 , 8F
nosql就是讓你這樣玩阿
02/09 09:40, 8F

02/09 09:43, 8年前 , 9F
正解…
02/09 09:43, 9F

02/09 11:29, 8年前 , 10F
樓上TA大的回覆深有同感QQ
02/09 11:29, 10F

02/09 14:32, 8年前 , 11F
你真的懂data warehouse嗎?:) 正規化是要看場合來使用的
02/09 14:32, 11F

02/09 19:26, 8年前 , 12F
推,一看就知道是內行。學術界老是講一堆xxx方法、模型
02/09 19:26, 12F

02/09 19:27, 8年前 , 13F
但是真正的實務只有三個要點:清資料、清資料還是清資料
02/09 19:27, 13F

02/09 19:27, 8年前 , 14F
有乾淨的資料一切都好談,否則什麼都是屁。GIGO
02/09 19:27, 14F

02/09 20:14, 8年前 , 15F
哈哈哈清潔工
02/09 20:14, 15F

02/09 21:01, 8年前 , 16F
掃地僧4ni
02/09 21:01, 16F

02/10 16:23, 8年前 , 17F
資料分析用'資料庫正規化'會很想死吧......
02/10 16:23, 17F

02/10 16:24, 8年前 , 18F
至於清資料也不用講得多神奇,主要是你對這個資料的了解...
02/10 16:24, 18F

02/10 16:24, 8年前 , 19F
知道怎麼用,那些有用,那些雜訊....
02/10 16:24, 19F

02/10 16:27, 8年前 , 20F
資料分析常常是一個資料表拿來用,'正規化'反而造成麻煩...
02/10 16:27, 20F

02/10 16:46, 8年前 , 21F
樓上幾樓說的沒錯 DW根本沒有正規化的問題
02/10 16:46, 21F

02/10 16:47, 8年前 , 22F
但是在那個大家都在玩DW的年代一堆公司DB都剛起步
02/10 16:47, 22F

02/10 16:47, 8年前 , 23F
然後看是凹MIS去學或找便宜工作室幫忙弄
02/10 16:47, 23F

02/10 16:48, 8年前 , 24F
然後就出現了因為OLTP->DW時 ETL亂寫進不去
02/10 16:48, 24F

02/10 16:50, 8年前 , 25F
但是DW是顧問開的 然後只好operational DB做去正規化到1NF
02/10 16:50, 25F

02/10 16:53, 8年前 , 26F
或是把DB跟DW混在一起做撒尿牛丸 設計成star-schema
02/10 16:53, 26F

02/10 16:54, 8年前 , 27F
這樣就沒有轉資料的問題了,大家都開心
02/10 16:54, 27F

02/10 16:56, 8年前 , 28F
如果資料是靠爬蟲或是open data去撈還好
02/10 16:56, 28F

02/10 16:57, 8年前 , 29F
如果是抱著整個資料庫來的挺多雷 裡面各種世界奇觀都有
02/10 16:57, 29F

02/11 10:18, 8年前 , 30F
推樓上大大跟這篇
02/11 10:18, 30F

02/11 14:01, 8年前 , 31F
推 我之前做report也都一直在整理資料 老是有莫名奇
02/11 14:01, 31F

02/11 14:01, 8年前 , 32F
妙的資料會被放進db
02/11 14:01, 32F
文章代碼(AID): #1QV83F-n (Soft_Job)
文章代碼(AID): #1QV83F-n (Soft_Job)