[心得] 中國 自然語言處理 NLP 工程師 面試心得
以下為本人今年 2019 4月到6月之間。
在中國面試的一些經歷。
稍微整理一下,讓大家看一下現況。
-------------------------
1. QQ 瀏覽器 - 全網知識圖譜 搜索問答
電話面試
word2vec 演算法細節,fasttext 演算法細節。
fasttext 相較於word2vec 的改進方法。
大量的 Char n-gram 如何存。
知識圖譜抽取過程,實體識別(NER),關系抽取(Relation Extract)。
關系抽取如何遠程監督學習(Distance Supervised Learning)。
對於知識圖譜建立還是問答系統比較有興趣。
多任務詞槽填空細節,意圖識別方法。
2. 百度 國際化輸入法 - 自然語言處理
Round 1: 電話面試
lstm 演算法與數學細節
訓練時 Batch size 如果決定
Rnn lstm gru 數學與參數量 比較。
Word2vec 演算法細節
Transformer 的 multi-head 目的,怎麽做。
公式的 Q,K,V 什麽意義,怎麽算出來。
Multi-head 的輸出怎麽算出來
兩個字串編輯距離演算法
Round 2: 現場面試,白板題
CRF HMM 兩種模型差異
如何 訓練 HMM
SVM 與 LR 差別在哪,從loss function 角度來思考。
給定一個排序後陣列 ,取 sum 為 n 的所有組合。
3. Lazada 數據科學家
Round 1: 電話面試
實體抽取模型細節
候選答案排序的權重計算
Attention 機制原理
有沒有使用過預訓練模型,BERT 懂不懂
Transformer 優點在哪
Round 2: 視訊面試
知識圖譜的建立,Entity 的屬性怎麼訂,有哪些類型的 Entity
臺灣跳到中國的原因,現在換工作原因,怎麼沒考慮內轉
對 Lazada 公司的了解,怎麼沒找競爭公司 蝦皮。
過去做的各種項目細節,有什麽改進的空間
項目為什麽用了 Transformer
導購機器人從無到有會怎麽做
沒語料又要做個性化標簽要怎麽做 怎麽規模化
(被反駁經驗不足:從無到有做導購, 不要馬上想做個性化,應該先做通用型的)
一周寫多少程式,最近寫了什麽程式
Binary search 怎麼做,計算複雜度。
分詞演算法,最大長度匹配 。
小語種 NLP 處理經驗
4. 字節跳動 Lark 自然語言處理
面試方式: 視訊 (ZOOM)
如何整理問答語料
如何驗證問答結果正確性
如何做對話狀態追蹤 是用什麼方法
文本分類的詞向量如何轉成句子向量
深度學習過擬合解決方法
為什麽dropout 可以解決過擬合
問答要做成各性化推薦怎麽做
質疑以往的各種項目業務價值不清楚。
質疑原公司團隊的技術分工不合理。
5. 阿里 無人車(小度車載OS) 自然語言處理
Round1: 現場面試,白板題
如何技術問答系統
用戶意圖不明,模糊語意下的各種處理方式。
用戶意圖不明時,多輪問答怎麼做。
Round2: 現場面試,有點像是批判性壓力測試。
叫你畫出 以往項目的各種系統架構。
開始對你的架構進行各方面的批評,並問你該怎麼改進。
準確率招回率如何提升。
總覺得對方一直在沒有目的的跳針,抓不到對方要的東西。
於是反問:你們需要怎樣的人。
對方: 我們需要的是,問答的回答不是用戶想要的情況。
要從架構的角度提出統一解,而不是修修補補的提出各種 Trick 解決片面問題。
Round3: 主管面
雙方確認彼此工作內容,雙方確認加班強度。
雙方交流車載系統現在市場現況,推行時的一些困難。
------------------
其他小公司就不說了,蠻雜亂的。
自己最後去的也跟以上無關,轉個方向去做推薦系統了。
職場觀察1: JD 掛羊頭買狗肉的行為很多。
簡歷刊登母公司,結果面試子公司。
招聘單位掛美國上市的趣頭條,結果打電話過來是母公司 InnoTech。
招聘單位是掛 阿里,結果打電話過來是 新加坡 Lazada。
招聘單位是 TCL 深圳,結果打電話過來是要人去香港。
招聘單位是 微軟 上海,結果要人去蘇州工作(年薪還不高)。
職場觀察2: 中國的國際化
中國內部市場競爭激烈,許多大廠的新業務都是在海外了
尤其是東南亞(因為打不進歐美)
只要是打著國際化業務,大概都是東南亞或中東業務居多。
觀察3: 沒有爽的工作
沒有高薪(稅前百萬以上)、有名氣(五百強,萬人互聯網公司),又能準時下班的。
抱歉,混了多年都沒遇到過。工程師正常都是 995 起跳,早回家就是反應在績效。
外商或許工時正常點? 但是薪資真的沒遇過相對高的。
(例如 Amazon,微軟 談過 工程師薪資也就一般)
自己待改善:
平時晚上都沒有很認真準備面試,很多基本演算法與數學都忘了細節。
Leetcode 沒在定期做,常常題目看過,大致知道怎麼做,但寫得不順。
機器學習,常常業務目標不同,做法會完全不同,
雙方沒意識此問題,會很難展示專業匹配程度。
---------------------
以上
※ 編輯: DrTech (27.44.120.163 中國), 08/11/2019 11:55:48
推
08/11 11:55,
6年前
, 1F
08/11 11:55, 1F
→
08/11 11:55,
6年前
, 2F
08/11 11:55, 2F
→
08/11 11:56,
6年前
, 3F
08/11 11:56, 3F
→
08/11 11:57,
6年前
, 4F
08/11 11:57, 4F
→
08/11 11:57,
6年前
, 5F
08/11 11:57, 5F
→
08/11 11:58,
6年前
, 6F
08/11 11:58, 6F
→
08/11 11:59,
6年前
, 7F
08/11 11:59, 7F
→
08/11 11:59,
6年前
, 8F
08/11 11:59, 8F
推
08/11 12:06,
6年前
, 9F
08/11 12:06, 9F
推
08/11 12:29,
6年前
, 10F
08/11 12:29, 10F
→
08/11 13:28,
6年前
, 11F
08/11 13:28, 11F
推
08/11 13:50,
6年前
, 12F
08/11 13:50, 12F
→
08/11 20:27,
6年前
, 13F
08/11 20:27, 13F
推
08/11 21:18,
6年前
, 14F
08/11 21:18, 14F
→
08/11 21:18,
6年前
, 15F
08/11 21:18, 15F
→
08/11 23:53,
6年前
, 16F
08/11 23:53, 16F
→
08/11 23:53,
6年前
, 17F
08/11 23:53, 17F
推
08/12 00:29,
6年前
, 18F
08/12 00:29, 18F
→
08/12 00:30,
6年前
, 19F
08/12 00:30, 19F
→
08/12 01:55,
6年前
, 20F
08/12 01:55, 20F
→
08/12 08:13,
6年前
, 21F
08/12 08:13, 21F
→
08/12 08:13,
6年前
, 22F
08/12 08:13, 22F
→
08/12 08:13,
6年前
, 23F
08/12 08:13, 23F
→
08/12 09:09,
6年前
, 24F
08/12 09:09, 24F
→
08/12 09:09,
6年前
, 25F
08/12 09:09, 25F
→
08/12 09:09,
6年前
, 26F
08/12 09:09, 26F
→
08/12 09:09,
6年前
, 27F
08/12 09:09, 27F
→
08/12 09:09,
6年前
, 28F
08/12 09:09, 28F
→
08/12 09:09,
6年前
, 29F
08/12 09:09, 29F
→
08/12 09:10,
6年前
, 30F
08/12 09:10, 30F
→
08/12 09:10,
6年前
, 31F
08/12 09:10, 31F
推
08/12 09:37,
6年前
, 32F
08/12 09:37, 32F
推
08/12 09:43,
6年前
, 33F
08/12 09:43, 33F
推
08/12 11:14,
6年前
, 34F
08/12 11:14, 34F
推
08/12 21:04,
6年前
, 35F
08/12 21:04, 35F
→
08/12 21:40,
6年前
, 36F
08/12 21:40, 36F
→
08/13 01:41,
6年前
, 37F
08/13 01:41, 37F
→
08/13 12:09,
6年前
, 38F
08/13 12:09, 38F
推
08/14 12:27,
6年前
, 39F
08/14 12:27, 39F
推
08/14 17:35,
6年前
, 40F
08/14 17:35, 40F
推
09/10 22:48,
6年前
, 41F
09/10 22:48, 41F
推
09/10 22:50,
6年前
, 42F
09/10 22:50, 42F