[北美] 美國PhD轉Data Scientist求職心得(二)

看板Oversea_Job作者 (judy)時間5年前 (2018/11/22 15:40), 5年前編輯推噓13(1309)
留言22則, 13人參與, 5年前最新討論串1/1
一、我的背景及轉職準備過程 二、介紹Insight Data Science Program 三、Data Scientist面試經驗分享 四、Offer negotiation心得分享 由於Insight的Data Science Program在我轉Data Scientist的求職過程中幫助我非常多 ,所以誠心推薦給想轉職Data Scientist的理工PhD。這一篇會介紹Insight Data Science Program、這個program對我的影響以及如何準備Insight Data Science Program的面試。 ◎關於Insight Insight是北美很紅又很競爭的Data Science相關的fellowhip program之一,他們主要 是幫助想進Data Science相關領域且有潛力的人轉職,就我所知所有的program都免費, 但是需要通過面試來決定能否被錄取,這部分可以上他們的官網看看: https://www.insightdatascience.com/。 目前Insight有很多不同領域的program,基本上都跟Data Science相關,例如像是Data Science、Data Engineering、Health Data、AI等等。但因為我只參加過Insight Data Science Program(以下簡稱為Insight),所以我只能分享個人對該program的相 關經驗。就我所知不同program的申請要求、內容以及面試過程會不太一樣,對其他 program有興趣的人可以去官網看看white paper及FAQ。 Insight的官網用一句話總結他們的program: 「An intensive 7 week post-doctoral training fellowhip bridging the gap between academia & Data Science」 其實這句話也只能算是很簡略地用一些關鍵字來描述這個program,以下分幾點介紹: 一、Insight到底在幹嘛? 其實Insight完全不是讓你來「上課」學Data Science的地方,如果你期待像補習班那樣 的授課學習方式可能會很失望,我參加的session裡從來沒有上過課,頂多有時有幾個熱 心的alumni來給過簡短的workshop而已。很多的fellow通常進來前就對Data Science有 一定的熟悉度了,不過當然也有少許像我一樣誤入叢林的小白兔,這樣一開始就會比較 辛苦了。 有關program詳細的內容我會在第二部份分享。簡言之,在Insight就是每個人要獨立做一 個data product,而且盡量要是沒人做過的,過程中會有機會跟Program Director、 alumni還有與你同session的fellow(同學們)一起討論。每個session大概會有十幾個 跟Insight合作的公司在不同的時間visit,每個公司會有約一小時的時間跟大家介紹他 們的公司並回答問題。 在我們做完data product後,可以選擇自己有興趣的公司做demo,每個人會有四分鐘 做presentation 並秀出自己的data product。如果公司對你有興趣,會在某個時間點 後call back並開始面試流程。除了做data product,Insight會協助你修履歷、LinkedIn 、教你怎麼準備並安排面試,還會提供你negotiate offer的建議,並會利用 alumni network在你求職不同的階段中幫助你。 二、誰適合Insight Data Science Program? Fellow基本上都是理科PhD╱candidate,且有分析數據經驗,至少會寫點code。但官網有 說他們也會考慮一些很有Data Science經驗的master。不過我參加的session的fellow以 及有接觸過的alumni全是PhD╱candidate。其中滿多人都是在博後的期間(甚至有些已經 在業界工作的還請假)來參加,我那個session十三位fellow裡只有三位是即將畢業的博 班學生,其他都是已經原本就有工作或正在學界博後的人。 三、參加Program的時間與長度? 一年有三次session,分別是在一月、五月及九月開始, program長度為七週且Insight要 求fellow必須是full-time dedication。這七週一定要是完全空出來沒有其他事的,否則 是一定負荷不來的。七週後可以開始跟Insight合作的公司面試,十五週後可以開始面試 其他非Insight合作的公司。 四、參加Program的地點? 目前北美的session有Silicon Valley/New York/Boston/Seattle/Toronto and Remote, 主要是根據自己想要在哪個地方求職來選擇,因為Insight只會介紹該地區的職缺給你。 由於我是想找芝加哥附近的工作,所以我參加了Remote(也就是不會介紹其他已存在 on-site program地區的職缺)。 Remote program的運作方式就是全部都是透過視訊會議的形式來進行,好處對我來說是 可以在家工作、穿著可以比較隨意、不用通勤、有時可以偷偷做其他的事還有給公司做 demo的時候可以光明正大看小抄XD;壞處大概就是無法跟fellow和其他人真正的面對面 互動(不過這對比較內向的人來說是好處><)。總之,我覺得remote session給了我很 大的自由度,且效果相較於其他in person的session我不覺得有打折,也省下了一些住 宿費用。 五、參加Program的花費? 完全免費,聽說非當地人如果被選上Insight還會提供一點點獎學金,真的是超佛的 program。而且program完後有任何問題都還可以找Program Director諮詢,當然也是免 費的。 六、參加完Insight後有多少人找到Data Scientist的工作? 官方的說法是至少有九成以上,而且最終大家都會找到工作。我參加的session總共有十 三位fellow,其中六位是透過Insight在其合作的公司拿到DS的offer,另外有五位是在 Insight結束後自己找到DS的工作,剩下的2位可能還在找。不過我想強調的是這些數據 僅供參考,因為不同人找工作會有不同偏好與限制,包括產業喜好、工作地點等等,所 以沒必要糾結到底program結束幾個月就業率多少的問題。 ◎Insight Data Science Program內容 接下來分享一下program大致的流程與內容,大致來說前三週都很辛苦,工作時間基本上 就是週一到週五,每天跟其他人有安排活動的時間大概是從早上八點到下午六七點,但 那之後幾乎每天都需要繼續弄project到晚上十二點、一點,吃飯洗澡等等都是很快速解 決。週末一天趕工一天休息。另外前三星期Insight也會安排一些workshop且會有 company visit,所以其實白天的時間被切割的滿零散的,能做專注project的時間並沒 有想像的多。 第一週: 想project idea與其實現方法、與fellow/Insight alumni/Program Director討論想做的 project、收集data,然後週五要做個四分鐘的demo跟大家報告自己想做什麼project。 這段時間看起來好像很輕鬆,但其實是最辛苦的,因為新的idea不好想,Insight跟大家 不會希望做之前有人做過的product,我們那梯次有不少fellow在討論的過程中project被 打槍好多次,因此換了好多次idea,這過程是非常挫折的,但是可以讓自己好好地想一想 什麼是有意義的data product跟deliverable。而且早期被打槍比較好,免得之後幾星期 開始做了發現遇到瓶頸反而沒辦法及時修正。 另外,自己收集跟清理data非常辛苦,不像Kaggle的data已經好好的放在網路上然後整理 得算乾淨。但是這種經驗對之後面試很有幫助,因為真實業界的data通常都很messy,且 收集data也一種技能,這些過程都是可以跟面試官分享的賣點。 第二週: 實現project idea,而且需要有個working 的minimum viable product(MVP),或是接 近完整的分析。週五demo給大家看,聽取意見。此時Insight也會邀請alumni幫忙一對一 給意見。 第三週: 補強MVP以及分析。如果是做interactive data product的人需要開始用flask跟其他工具 將product放到AWS上(大部分fellow做的product都是這樣)。另需開始製作demo的 slides。Demo長度約4分鐘,內容需包含「為什麼想做這個產品?」、「實際展示 live data product(能夠即時接收input跟送出output)」、「方法」以及 「validation╱測試結果」等等,然後週五demo給大家看。這時候的data product 已經要很完整了。 第四週: 開始不斷練習demo,這星期幾乎每天都要跟fellow或是alumni demo,然後參考大家的意 見精修presentation。 第五週到第七週: 這段時間是面試的準備,並會開始demo你做的data product 給Insight邀請的公司看。如 何決定自己是否能夠demo給心儀的公司看則是取決於當時sign up想demo的人數。通常一 次他們不會安排超過12個人demo給一間公司看,可能怕效果不好然後hiring manager會聽 到睡著XD。demo之後也會開放公司對講者提問五分鐘,所以一位fellow會有四分鐘的demo 以及五分鐘的Q&A。 除了demo之外,其他準備面試的部分,Insight會提供一個超長的面試準備清單以及一個 很大的電子書資料庫。準備的項目如第一篇文章提到大概粗分為六類:SQL、 CS Fundamentals、ML知識、Stats、Business Case Studies和Behavioral interview questions。 這三個星期幾乎每天都要跟fellow練習面試,另外Insight也會邀請很多已經在業界工作 的alumni幫忙模擬面試。這也是跟其他Insight alumni建立connections的機會,有時候 面完會跟alumni閒聊一些他們之前在Insight的經驗以及工作經歷等等。有時Insight會 安排一些workshop可以自由參加,每週會做一次data challenge,是個很好練習hands-on 的機會,做完大家會一起討論結果。 七週之後program算是結束了,但是還是會有一些meeting或workshop可以自由參加。 第七週到第十五週: 開始跟Insight合作的公司面試。同時如果有任何需要或問題都可以直接私下或在公開 的slack頻道跟Program Director討論。例如安排與alumni的模擬面試、安排正式面試 或討論準備的策略等等。 第十五週之後可以開始面試其他非Insight合作的公司。 ◎Insight對我的意義與其價值 如同我在第一篇文章裡提到的,雖然我的Data Scientist offer不是透過Insight拿到的 ,但Insight在我轉Data Scientist的求職過程中扮演了很重要的角色。我覺得如果我 沒有參加Insight,我不太可能拿到這麼好的offer。下面就分享一下我在Insight學到什 麼以及它帶給我的價值。 一、改變對業界Data Science的想法 在參加Insight之前,也許是受Kaggle追求結果精準度的影響,本來以為在業界做Data Scientist需要會很厲害很fancy的ML model。參加Insight後才發現很複雜的model其 實不一定是個成功的產品,超級精準的結果也不是業界追求的,真實世界裡還是有些 trade-off需考慮,像是為了多百分之幾的精準度的成本付出是否划算?還有模式與結 果的interpretability等等。 另外就是對data product的impact跟產品背後故事的重視。我們在做project的過程中, Program Director一直很要求我們去思考自己做的產品有什麼deliverable以及實際上的 使用,有很多fellow的project被要求更改都是因為這個原因,而Program Director常常 會說那些被打槍的project以及一些Kaggle上的project比較偏 「學術」,而非一個商業 的產品可以給人即時使用。 這些衝擊對我來說很大,也讓我在之後面試時常常會想到很多有趣的問題可以跟面試官討 論。越到後來,很多面試官都覺得我能問出很有深度的問題跟觀點,而這些都是在我參 加Insight後,透過討論、觀察別人的產品、獲取面試者的回饋後,慢慢累積自己的想法 後才能問出來的問題。 二、清楚地表達data product的故事 這個跟本身presentation技能有點關係,我自己在PhD時期有被訓練過,所以這方面不 算是我在Insight學習到的新東西。不過沒有這個skill的人也沒關係,Insight也會幫你 一步步練習的。在你做demo的presentation的時候,Insight會盡量幫助你完成你的 data product的故事。 而這個故事也會是之後你跟面試官介紹在你的project的框架。我的做法是先敘述一個 待解決的問題當作motivation,接下來再介紹如何建立這個產品,從資料收集開始、 然後用簡單的語言描述自己用了哪種模式或演算法,稍微說一下背後的原理、中間遇 到什麼困難等等,最後說結果如何(例如可以省多少錢?多少時間?或是模式的表現 之類的)。主要就是keep it simple,要先以引起聽者的興趣為目的,如果面試官對 哪個環節有興趣你可以說你願意多聊聊,這樣面試的時候會比較像是一個雙方面的對話 而非你單方面滔滔不絕的講。如果一開始講太複雜,對方聽的都暈了也不會想再跟你繼 續聊,這樣就白白浪費了一個機會很可惜。還有就是要一直不斷地想,自己的產品有什 麼可以改進之處,這也可以算是建立這個產品故事的一部分,幾乎每個面試官都會問 How can you improve your product。 三、提供準備面試的大方向與Mentorship 如之前所述,在Insight除了做data product,Insight還會舉辦resume workshop、 LinkedIn workshop教你如何寫Data Scientist的履歷以及建立專業的LinkedIn profile ,並且Program Director會親自幫你過目及修改resume,還會約meeting給你feedback。 Program Director其實會常常跟各個公司的hiring manager喝咖啡來建立關係,他們也帶 過上百個現在都是業界的Data Scientist的alumni,有這樣專業的人免費幫修改履歷幫助 真的非常大。 做完產品後,Insight會辦幾個小workshop教你怎麼準備並安排面試,甚至教你如何 negotiate offer,對一個new grad或是沒有在業界工作經驗的人這些都是非常珍貴的資 源跟經驗,這部分會在下兩篇文章內分享。 雖然我在前面強調過Insight不是填鴨式的補習班,比較像是在collaborative的環境之下 獨立做project的過程中學習,但在各個階段都會感到滿滿的mentorship與支持,不論是 Program Director本人、其他客座的Program Director、其他Insight alumni 以及你的 戰友們,都會一直給你建議、鼓勵你並陪你一起走過這條辛苦的轉職路。 四、越過HR,透過demo直接把你擺到Hiring manager前 有自己海投過工作的都知道,這是非常大且有效率的boost。其他地區的program我不清 楚,不過我參加的Remote Program大概有十幾個公司來visit。當時我參加的session據說 人比較少,所以大家幾乎只要有sign up自己想demo的公司就會有中。雖然demo過後不一 定會被公司邀請interview,但至少可以確定hiring team有看過你的資料與demo表現,而 不是像自己投履歷很可能石沉大海。我們那屆call back for interview的比例還滿高的, 我那時demo過七家公司,有6家有邀請interview。而且我敢說如果我不是透過Insight而 是自己網路海投那些公司,以我的經歷來說我是一定不會有面試機會的。另外有些大公司 雖然沒有來參加demo,但是他們已經跟Insight建立長期合作關係,都會固定向Insight 要fellow的履歷,這也是一些潛在的機會。 五、強大的Alumni network 其實參加Insight,有沒有在那段時間透過Insight找到工作不是最重要的,Insight最強 大的是它的alumni network。如前面有提到,在找Data Scientist工作的過程中,不論 是你想討論做data product的idea或方法、模擬面試、甚至在你面試某些有Insight alumni的公司時,想reach out討論跟準備面試,都可以找到人來幫助你。當時我參加 的session的Program Director人非常好,她會追蹤我們所有面試的進度,常常會主動問 我需不需要幫我找某些在我面試的公司工作的alumni,或是找alumni幫我額外做模擬面試 等等。而我有接觸過的alumni都很熱心,他們在我找工作的過程當中真的給我很大的鼓勵 與幫助。 舉些例子:有位NY program的alumna在通過一次視訊後,都會不時地關心我找工作的情況 ,在我的session結束後她還介紹了其他recruiter跟其他工作給我。而且我在收到她的公 司的phone screen邀請時,她還願意在晚上9點打電話跟我提醒一些面試需注意的事項。 另外還有位在保險公司工作的alumna,願意跟我講了1小時多的google hangout,給我做 另一保險公司的data challenge的建議。在我面試某家很大的management consulting公 司時,也有位alumnus願意跟我通電話,教我怎麼準備case interview跟聊聊他的工作情 況。最後即使我後來靠自己找工作,在拿到現在這家公司的offer時,Program Director 還幫我聯絡到之前在這家公司工作的alumnus,他當時知道我在決定offer時間很緊, 二話不說直接跟我馬上約週末通電話,而且他竟然還認識以後會跟我合作的同事,在跟 他聊了以後覺得更可以安心地做決定。 六、履歷上有Insight的經歷後更容易拿到Data Scientist面試機會 我在參加Insight之前有稍微投過一些職缺,大部分都是跟氣象或農業相關,也有少部 分的Junior Data Scientist,收到的面試邀請真的寥寥無幾。但參加完Insight後我自 己投Data Scientist工作,真的明顯感受到面試邀請增加不少,而且很多都是我未曾想 過我能夠涉入的領域。我覺得如果我沒有Insight的經驗在履歷上,以一個new grad沒 有任何業界工作經驗的非相關科系PhD,HR/Hiring manager根本不太會看我的履歷。 另外Insight真的在Data Science業界很有名,我在面試自己投的公司時很多HR跟面試 官都有聽過甚至了解Insight,我猜想可能是Insight選fellow時很嚴格,所以參與者有 一定的程度,公司會比較相信且願意給Insight fellow面試的機會。 七、Program結束後任何問題都可以詢問Program Director 前面已經有提過Program Director在我找Data Scientist工作時的角色與幫助,有一點讓 我很感動的是雖然我沒有在Insight找到工作,但Program Director從來沒有放棄過我,而 且在program結束後一直到現在我打這篇文章時,她還會不時地跟我check in詢問我需不 需要幫助,即使我沒有讓Insight透過仲介這個角色賺到錢,但他們對我的付出真的不曾 少過。 在program結束後,Program Director在知道我只想要找芝加哥附近的工作時,仍是非常 努力想要幫助我,甚至前陣子在新的remote session裡有芝加哥的company visit,他們 還邀請我加入並幫我安排跟新的fellow們一起demo,真的很窩心。可惜在收到這間跟 Insight合作的公司面試邀請後不久,我就拿到了兩個offer。由於時程的關係,我只好 取消那家面試,Program Director也沒有因此不開心,而且即使手上兩個offer的公司都 不是Insight合作的公司,Program Director還是非常認真地教我如何評價這兩個offer、 如何跟公司negotiate以及跟教我一些跟公司應對的策略,甚至也說可以幫我proofread我 所有跟公司交涉的email來避免一些不必要的錯誤,那段時間真的深深地再次感受到 Insight對他們fellow的用心,還有他們付出在經營與fellow的關係上的心力,真的非常 感謝他們的幫忙。 ◎如何準備Insight面試以及面試經驗分享 Insight目前在北美算是數一數二競爭的Data Science Program,原因是因為Program本 身免費,在資源有限的情況下Insight當然會做好fellow的品質控管。想參加的人必須 經過兩輪面試,大致分為三個關卡: 一、履歷與填寫申請資料 在申請的時候需要附上履歷以及回答一些問題。回答問題的訣竅就是用非常簡單的語 言跟清晰的邏輯來介紹自己的研究工作(最好是簡單到解釋給外公外婆都聽得懂的那 種),並盡量強調跟Data Science的相關性。回答問題時有些事項可以用條列式的方 法來呈現,例如paper、conference以及使用不同tools的經驗。另外如果有LinkedIn 跟GitHub的話也建議一起附上。 二、Initial Interview 如果申請有被選中的話,會跟program manager(無technical background)用Zoom面試 ,大概會講15分鐘左右。這部分比較輕鬆,基本上就是介绍自己的背景與研究,聊聊為 何想參加Insight以及問一些logistics的問題(例如畢業時間、簽證、是否願意完全空 出七星期來參加Insight等等),最後有問題也可以提問。 三、Technical Interview 如果有過第一關的話,接下來就會被邀請跟Program Director(通常都是有 technical background的PhD)進行約30分鐘的technical interview。在進行這個面試 前,Insight會要求面試者需準備一個跟Data Science有關的project的demo,面試的過 程會要求share screen給面試官從頭到尾說明自己的code、思路還有visualization等 等。討論的內容有可能包含:為什麼要做這項project、為何要用這個模式或方法、為 何選這個參數、如何詮釋結果的意義等等。 我那時候的demo就是用我剛學Python「翻譯」的一個分析 ,然後用jupyter notebook寫 並放在GitHub上,我覺得用jupyter notebook感覺有加一點分,因為可以同時給面試官 看code跟一些文字╱數學式的註解,並可以馬上看結果分析的圖。另外給面試官看code 之前,我也有特別做一份介紹研究背景的slides,簡短說明一下相關的氣候知識跟研 究walk-through,避免在講做分析的code的時候會讓面試關太難follow或gets lost。 Technical interview時面試官也會問一些behavioral的問題,例如自我介紹、介紹自己 的研究、還有可能會問為什麼想轉Data Science、來Insight後有想做什麼project、要 如何收集想做的project的資料等等。這些問題都需要自己先想過並準備的,glassdoor 上也有很多面試題分享,有興趣的人也可以參考一下。 總結一下幾個重點: →申請跟面試的過程中,解釋任何東西要盡量簡單明瞭,前因後果要說清楚,最後 impact部分可以強調一下。舉例來說:我的model顯示A可以影響B,但不要只敘述這件事 ,而是要更強調有誰可以用你的model做什麼用途,產生什麼impact等等。我參加完 Insight後感覺他們很希望fellow跳脫太學術性的思維。所以如果在面試的demo時,能把 結果後面的interpretation加強一下,應該可以讓你跟其他面試者分出高下。 →練習練習再練習。Behavioral questions跟demo絕對是要練習的,可以試著說給不同領 域的朋友聽。至於demo的話你寫的code跟使用的參數、模式或其他演算法一定要很熟悉, Program Director是有可能問很深入的。 Insight的心得先分享到這邊,以上都是我個人的經驗,當然不是所有fellow都會有一樣 的感受,而且Insight也不一定適合每個人的學習方法。不過以理工PhD想轉Data Science 領域來說,Insight還是很好的program。希望這篇文章能夠幫助到對Insight有興趣的朋 友們,如果沒能參加也沒關係,有時候真的也是運氣的問題。我相信其中有很多部分也是 可以自己學習的。如果對這個program有問題都歡迎推文詢問,我會盡量回答。 祝各位感恩節快樂! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.13.233.115 ※ 文章網址: https://www.ptt.cc/bbs/Oversea_Job/M.1542872440.A.6D7.html

11/22 15:44, 5年前 , 1F
11/22 15:44, 1F

11/22 15:47, 5年前 , 2F
2週做出MVP 3週上線 好短啊
11/22 15:47, 2F

11/22 15:52, 5年前 , 3F
大推介紹,其實我剛拿到Insight Data Engineer的offer
11/22 15:52, 3F

11/22 15:52, 5年前 , 4F
請問DS跟DE兩邊的fellows會一起合作做presentation嗎?
11/22 15:52, 4F

11/22 15:53, 5年前 , 5F
先謝謝你的回覆! :)
11/22 15:53, 5F

11/22 17:49, 5年前 , 6F
11/22 17:49, 6F

11/22 20:07, 5年前 , 7F
推推
11/22 20:07, 7F

11/22 23:16, 5年前 , 8F
11/22 23:16, 8F

11/23 22:04, 5年前 , 9F
推分享
11/23 22:04, 9F

11/24 01:16, 5年前 , 10F
三樓O大你好,我是現在的Insight fellow, DS跟DE不會合作
11/24 01:16, 10F
謝謝P大回答,的確是不會合作,而且DS program內部的fellow也不會合作一個project, 都是自己做一個end-to-end的project。

11/24 01:58, 5年前 , 11F
打算申請remote, 如果申請到這七個禮拜回台灣可行嗎?
11/24 01:58, 11F

11/24 02:03, 5年前 , 12F
原po有提到前三個禮拜有company visit,如果是remote還會
11/24 02:03, 12F

11/24 02:03, 5年前 , 13F
有這類的company vist嗎?
11/24 02:03, 13F
Insight FAQ的確寫到fellow可以在任何地方參加remote,但是要提醒你的是因為這7個星 期Insight會安排很多行程是需要視訊參加的,而且他們的時間是以9am-6pm Pacific Time為主,另外跟alumni的一對一討論有可能會更晚,這些都必須考慮進去。 附上FAQ連結https://www.insightdatascience.com/faq Remote一定會有company visit喔!只是都是用Zoom視訊方式參加。之後demo給company也 是用這樣的方式。

11/24 03:20, 5年前 , 14F
謝謝樓上P大! :)
11/24 03:20, 14F
※ 編輯: judykeystsai (24.13.233.115), 11/24/2018 04:49:49

11/24 09:24, 5年前 , 15F
請問insight fellow, DE寫完coding challenge後沒下文
11/24 09:24, 15F

11/24 09:24, 5年前 , 16F
是不是就是rejection ?
11/24 09:24, 16F

11/25 03:08, 5年前 , 17F
被打槍的project以及一些Kaggle上的project比較偏 「學
11/25 03:08, 17F

11/25 03:08, 5年前 , 18F
11/25 03:08, 18F

11/25 03:09, 5年前 , 19F
好奇以原PO讀過博士的背景是不是會覺得DS不需要博士?
11/25 03:09, 19F

11/27 03:32, 5年前 , 20F
我有聽說remote session公司比較多是不sponsor visa的
11/27 03:32, 20F

12/02 23:08, 5年前 , 21F
remote跟local哪一個比較容易申請上呢?
12/02 23:08, 21F

12/04 21:00, 5年前 , 22F
這樣看起來現在碩畢搶先卡位比去讀個DS方向PhD更有利
12/04 21:00, 22F
文章代碼(AID): #1RzbruRN (Oversea_Job)