[情報] 黃博士今日演講內容

看板GO作者HeterCompute (異質運算)時間6年前 (2017/11/10 13:23)推噓23(23推 0噓 21→)

留言44則, 18人參與討論串1/1

簡單提一下今天黃博士演講重點演講標題是深度學習與強化學習的勝利認為zero是最佳的deepmind電腦圍棋這部分最佳的收尾黃博士對於一開始擊敗樊輝就發nature有些不解，我們要挑戰李世石結果把所有技術都透漏給所有人，但deepmind的想法是我們需要分享技術讓世界一起進步 google對alphago團隊最大幫助是TPU 認為Master已經完美解決李世石第四盤的bug，解決方式與神經網路架構(dual res)和訓練都有關，並且以他多年的電腦圍棋經驗與測試過後，認為不會再出現此類bug Master是20block res-net，並改進了training pipeline和MCTS，也解決了模仿棋和循環劫(沒說怎麼做)，能讓lee版本3子並超過50%勝率 master年初60連勝每一步4-8秒，在台灣，吃泡麵配黑松沙士下的，是黃博士積極鼓吹要出來測試，Hassabis說要低調並使用韓國國籍，一開始不得透漏身分 Hassabis說要挑強的下，但是第一天職業沒人願意跟0勝0負的下，都被拒絕，等到第一天10連勝之後第二天開始拒絕別人邀請 master下的時候可以看勝率隨步數的圖，基本上50手之前斜率很高並且確立極大優勢，唯一例外是柯潔烏鎮第二盤 4月的時候已經有zero，但由於要發nature所以不能拿來下當初開發zero沒預料到會超過master master年初開發完畢之後，zero由其他人負責開發，黃博士繼續想方法增強master zero不是放在那邊增強學習就會變強，中間需要做很多優化，否則有bug不會進步，其中一個重大bug發生在第三天(紀錄人表示：所以看來絕藝有得忙了 AntiAlphaGo，不是像大家想的那樣有新的技術，就是左右互搏，也不是gan(生成式對抗網路) master是否被人類棋譜拖累？答案是不確定，因為master訓練時間較短，deepmimd也沒有針對同等條件去比較。以上，有其他疏漏請其他人補充，並歡迎轉載，但請說明作者是Hetercompute ----- Sent from JPTT on my Samsung SM-A710Y. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.127.9 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1510291395.A.4F4.html

推

staristic

11/10 13:28, 6年前 , 1^F

11/10 13:28, 1^F

推

CGary

11/10 13:42, 6年前 , 2^F

11/10 13:42, 2^F

推

yys310

11/10 14:11, 6年前 , 3^F

11/10 14:11, 3^F