[徵文] 對話式AI專欄: Chatbot對話管理篇

看板Soft_Job作者lion741205 (獅子)時間4年前 (2020/03/30 02:29)推噓16(16推 0噓 18→)

留言34則, 13人參與討論串1/1

年初決定寫個對話式AI專欄，把個人在業界的開發經驗寫下來，到目前為止已經有七篇文章了，詳述了聊天機器人框架的方方面面；第八篇文章還在拖稿時，碰到Soft Job版徵文活動，覺得本系列非常契合活動的技術與實務經驗分享宗旨，相關知識也不是隨便就能取得的，就趁今晚打著夜燈，熬夜把它給寫完了，在此分享給各位業界先進。【閱讀本文前建議先看】 http://www.lionethan.com/Chatbot的類型與對比/ http://www.lionethan.com/Chatbot的閱讀能力-自然語言理解篇/ 【什麼是對話管理】聊天機器人的對話管理（Dialogue Management）是為了根據目前的對話狀態，決定系統應該做些什麼。通常分為兩個子模組，負責更新對話狀態的「對話狀態追蹤」（ Dialogue State Tracking），其輸入自然語言理解模組所得到的使用者動作，以及過往的對話歷史，輸出對話狀態；以及決定系統動作的「對話策略學習」（Dialogue Policy Learning），其輸入對話狀態，輸出系統動作。上述的「使用者動作、對話狀態、系統動作」皆可用一個意圖與一組槽位值表示。【對話狀態追蹤】目的是透過「使用者動作」及「對話歷史」更新對話狀態，其對話歷史可能隱含著因資訊不足，經過系統反問使用者後，產生的「多輪對話內容」；有些需求還會參考使用者畫像（User Profile），以補足必要的「個性化資訊」。透過推理和總結上述內容，轉換成簡單的對話狀態（一個意圖與一組槽位值），系統可以將當前的對話狀態映射成更完整的表示（Representation）。為了考慮自然語言的模稜兩可，語音辨識或自然語言理解模組所產生的失誤，根據可能正確的使用者動作數量，可進一步分成只考慮置信度最高的1-Best ，以及考慮多個使用者動作與置信度的N-Best方法。【對話策略學習】目的是透過「對話狀態」決定系統該做些什麼，如果對話狀態的意圖在系統能夠提供的服務項目之內，系統會檢查槽位值是否齊全，然後使用其內容查詢服務API，以得到關鍵答案或內容；若對話狀態的意圖不明，或其符合特定服務但槽位值有缺失，系統應該主動向使用者提問，透過多輪對話及對話狀態追蹤來蒐集足夠的資訊。最後將關鍵答案或內容封裝到系統動作中，以一個意圖及一組槽位值代表，提供給自然語言生成模組（Natural Language Generation）。【對話管理的實作方法】基於規則（ Rule-based ）的方法，透過編寫明確的規則，來建立各種槽位狀態下，使用者動作所對應的系統動作，此種方法無法處理不確定的狀態，且需要手工編寫規則，僅適合特定領域的簡單場景。基於有限狀態機（Finite-State Machine, FSM），此種方法又可分為「以點代表槽位狀態，以邊代表系統動作」，以及「以點代表系統動作，以邊代表槽位狀態」兩種方案；槽位狀態可分為有或無，系統動作則是詢問槽位或最後回答兩種，為避免置信度過低，也可以增加動作請使用者二次確認。由於前者在槽位增加時，會使狀態數量急遽增多，只適合資料驅動的方式；若要以手工建置會建議採用後者。採用有限狀態機的優點在於實作簡單，且容易理解，缺點是每個狀態和動作都要手工設計，不利於複雜場景。基於統計（Statistical-based）的方法，通常採用馬可夫鏈（Markov Chain）將對話過程表示成決策過程，而系統在每個對話狀態中決定下一步動作。採用馬可夫鏈的優點在於只需要在決策過程中定義槽位狀態與系統動作，就可以自動學習到狀態的移轉關係，也可在過程中導入強化學習（Reinforcement Learning）與線上學習（Online Learning），缺點是同樣需要手工設計，不利於複雜場景。基於深度學習（Deep Learning）的方法，輸入使用者動作及相關特徵，輸出對應的系統動作，以訓練深度類神經網路模型。基於深度學習的方法需要大量訓練資料才能夠取得效果，目前實際應用上還難以滿足此須求。【對話管理的具體流程】 1.自然語言理解模組取得使用者對話「推薦我一家台北的餐廳」，此時會偵測使用者意圖及識別命名實體，並將結果封裝成使用者動作（意圖=推薦餐廳, 地點=台北），得以將自然語言映射成簡單的語意表示。 2.對話狀態追蹤模組透過使用者動作（意圖=推薦餐廳, 地點=台北）更新當前的對話狀態，然後在地點填充常用的預設值，並透過使用者畫像補充用餐的個性化資訊，最後輸出對話狀態（意圖=推薦餐廳, 地點=台北公館, 口味=喜歡吃辣）。 3.對話策略學習模組得到對話狀態後，發現其意圖在系統能夠提供的服務項目之內，但還缺少了用餐時間，系統應該反問使用者；所以輸出系統動作（意圖=對空白槽位提問, 地點= 台北公館, 口味=喜歡吃辣, 時間=Null）。 4.自然語言生成模組執行系統動作，產生問句向使用者提問欲用餐的時間「你想在什麼時間用餐呢？」。 5.自然語言理解模組取得次輪的使用者對話「明天中午」，再次偵測意圖及識別命名實體，得到使用者動作（意圖=不明, 時間=2020年3月30日12點）。 6.對話狀態追蹤模組參考使用者動作及對話歷史，更新當前的對話狀態（意圖=推薦餐廳, 地點=台北公館, 口味=喜歡吃辣, 時間=2020年3月30日12點）。 7.對話策略學習模組利用使用者動作及對話歷史，蒐集餐廳推薦服務的必要資訊，透過查詢服務API得到答案後，封裝成系統動作（意圖=推薦餐廳, 地點=台北公館, 口味=喜歡吃辣 , 時間=2020年3月30日12點, 餐廳=右手餐廳, 類型=泰式料理）。 8.自然語言生成模組執行系統動作，產生具體答案「建議你明天中午可以到台北公館的右手餐廳享用酸辣的泰式料理」。【未來的發展方向】為了解決基於深度學習的對話管理方法，在訓練資料上普遍不足的問題，業界已嘗試使用 N-Shot Learning在小樣本下進行訓練，以及使用Zero-Shot Learning在沒有任何訓練資料的情況下，進行現有模型的遷移與補全，以及在馬可夫鏈決策過程中，導入強化學習與線上學習，建立獎懲與持續學習的機制；也有學者將GAN應用在自然語言處理上，透過 SeqGAN讓兩個模型相互博弈，以學習最強的對話策略。【參考文獻】 POMDP-based Statistical Spoken Dialogue Systems: a Review http://mi.eng.cam.ac.uk/~sjy/papers/ygtw13.pdf Maximum Entropy Markov Models for Information Extraction and Segmentation http://www.ai.mit.edu/courses/6.891-nlp/READINGS/maxent.pdf Reinforcement Learning https://en.wikipedia.org/wiki/Reinforcement_learning One-Shot Learning https://en.wikipedia.org/wiki/One-shot_learning Zero-Shot Leaning https://en.wikipedia.org/wiki/Zero-shot_learning SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient https://arxiv.org/abs/1609.05473 【其他對話式AI專欄文章】 http://www.lionethan.com/Chatbot的類型與對比/ http://www.lionethan.com/基於知識庫的問答系統實作方法/ http://www.lionethan.com/模組化的任務導向對話系統實作方法/ http://www.lionethan.com/Chatbot的閱讀能力-自然語言理解篇/ http://www.lionethan.com/Chatbot的記憶與決策-對話管理篇/ http://www.lionethan.com/Chatbot的寫作能力-自然語言生成篇/ (預計四月完成) http://www.lionethan.com/預訓練語言模型比較（elmo、bert、gpt-2）/ http://www.lionethan.com/Chatbot的挑戰與發展趨勢/ http://www.lionethan.com/AI研發部門與開發流程介紹/ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.25.155 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1585506572.A.430.html

推

hentai

03/30 10:13, 4年前 , 1^F

03/30 10:13, 1^F

推

ian90911

03/30 10:45, 4年前 , 2^F

03/30 10:45, 2^F

推

SuperSunny

03/30 13:16, 4年前 , 3^F

03/30 13:16, 3^F

推

vvind

03/30 14:18, 4年前 , 4^F

03/30 14:18, 4^F

又做了一些補充，感謝閱讀

推

qrtt1

03/30 16:49, 4年前 , 5^F

03/30 16:49, 5^F

推

single4565

03/30 19:25, 4年前 , 6^F

03/30 19:25, 6^F

→

DrTech

04/02 12:37, 4年前 , 7^F

04/02 12:37, 7^F

→

DrTech

04/02 12:41, 4年前 , 8^F

04/02 12:41, 8^F

我日前在業界帶領團隊研發新一代Chatbot產品，而敝司在此領域已經有近十年的經驗了；這些文章是以個人業界研發經驗為主，廣讀的Paper為輔，每一字一句都是直接憑著記憶，思考和內化後親手撰寫的總結與心得。不是任何學術文章的翻譯，而且完全出於業界的實務需求；文章也已經盡量力求完美，如果相關內容有錯誤或不符合現況，歡迎提出具體問題，一起討論交流加以完善。

推

tommykang

04/02 15:47, 4年前 , 9^F

04/02 15:47, 9^F

→

tommykang

04/02 15:47, 4年前 , 10^F

04/02 15:47, 10^F

不會啦！同樣是對話式AI，每間公司的研發方向和腳步不同，有不同的業界經驗是正常的，也因為這樣才會有分享的價值。另外，這類文章我比較偏好邏輯論述寫作技巧，所以讀起來有學術味，比較不帶情感。

推

a2551127

04/02 17:41, 4年前 , 11^F

04/02 17:41, 11^F

→

a2551127

04/02 17:41, 4年前 , 12^F

04/02 17:41, 12^F

→

a2551127

04/02 17:41, 4年前 , 13^F

04/02 17:41, 13^F

謝謝，完成自然語言生成篇後，會想先講講"知識圖譜"在業界的實際應用情況。

推

tommykang

04/02 18:56, 4年前 , 14^F

04/02 18:56, 14^F

→

tommykang

04/02 19:00, 4年前 , 15^F

04/02 19:00, 15^F

你的意思應該是Chatbot一詞"不只代表閒聊"，其實還包含問答與任務導向對話系統，大家常常誤解這點，也是我親手寫專欄的用意，希望能帶給大家正確的觀念。

→

DrTech

04/03 09:00, 4年前 , 16^F

04/03 09:00, 16^F

如果有請你貼上來，咱們比對一下驗真章，不打迷糊仗絕對沒什麼原始論文，因為單純就是團隊研發Chatbot框架的經驗分享與心得

→

DrTech

04/03 09:00, 4年前 , 17^F

04/03 09:00, 17^F

→

DrTech

04/03 09:00, 4年前 , 18^F

04/03 09:00, 18^F

→

DrTech

04/03 09:00, 4年前 , 19^F

04/03 09:00, 19^F

我也不認同，隨便去說你不專業，如同你說的都是同業，請相互尊重

→

DrTech

04/03 09:03, 4年前 , 20^F

04/03 09:03, 20^F

→

DrTech

04/03 09:03, 4年前 , 21^F

04/03 09:03, 21^F

→

DrTech

04/03 09:07, 4年前 , 22^F

04/03 09:07, 22^F

允許我再次說明，這些文章不是學術文獻的翻譯，每一字一句都是以個人業界經驗為主，廣讀的文獻為輔；經過思考和內化後，直接憑著記憶，親手撰寫的總結和心得，而且完全以業界實務的觀點撰寫。文章除了闡述敝司和業界慣用的模組化架構、系統流程和個人舉例說明與心得，只有在少許篇幅，用一兩句話列舉敝司或業界在各環節常用的方法名稱，並從個人經驗或團隊聽聞中闡述其優缺點，所以沒有去找那些方法的學術出處；以一篇專欄文章來說，這樣的寫法合情合理，希望你能夠理解。但既然DrTech大大都提了，為了避免任何爭議，我也已經開始盡力尋找，我在文中提到的所有方法，以及敝司和業界常用架構的學術出處，將逐步整理到參考文獻中。

推

jimmy55311

04/03 11:26, 4年前 , 23^F

04/03 11:26, 23^F

→

jimmy55311

04/03 11:26, 4年前 , 24^F

04/03 11:26, 24^F

→

jimmy55311

04/03 11:26, 4年前 , 25^F

04/03 11:26, 25^F