[情報] 黃博士今日演講內容
簡單提一下今天黃博士演講重點
演講標題是深度學習與強化學習的勝利
認為zero是最佳的deepmind電腦圍棋這部分最佳的收尾
黃博士對於一開始擊敗樊輝就發nature有些不解,我們要挑戰李世石結果把所有技術都透漏給所有人,但deepmind的想法是我們需要分享技術讓世界一起進步
google對alphago團隊最大幫助是TPU
認為Master已經完美解決李世石第四盤的bug,解決方式與神經網路架構(dual res)和訓練都有關,並且以他多年的電腦圍棋經驗與測試過後,認為不會再出現此類bug
Master是20block res-net,並改進了training pipeline和MCTS,也解決了模仿棋和循環劫(沒說怎麼做),能讓lee版本3子並超過50%勝率
master年初60連勝每一步4-8秒,在台灣,吃泡麵配黑松沙士下的,是黃博士積極鼓吹要出來測試,Hassabis說要低調並使用韓國國籍,一開始不得透漏身分
Hassabis說要挑強的下,但是第一天職業沒人願意跟0勝0負的下,都被拒絕,等到第一天10連勝之後第二天開始拒絕別人邀請
master下的時候可以看勝率隨步數的圖,基本上50手之前斜率很高並且確立極大優勢,唯一例外是柯潔烏鎮第二盤
4月的時候已經有zero,但由於要發nature所以不能拿來下
當初開發zero沒預料到會超過master
master年初開發完畢之後,zero由其他人負責開發,黃博士繼續想方法增強master
zero不是放在那邊增強學習就會變強,中間需要做很多優化,否則有bug不會進步,其中一個重大bug發生在第三天(紀錄人表示:所以看來絕藝有得忙了
AntiAlphaGo,不是像大家想的那樣有新的技術,就是左右互搏,也不是gan(生成式對抗網路)
master是否被人類棋譜拖累?答案是不確定,因為master訓練時間較短,deepmimd也沒有針對同等條件去比較。
以上,有其他疏漏請其他人補充,並歡迎轉載,但請說明作者是Hetercompute
-----
Sent from JPTT on my Samsung SM-A710Y.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.127.9
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1510291395.A.4F4.html
推
11/10 13:28,
6年前
, 1F
11/10 13:28, 1F
推
11/10 13:42,
6年前
, 2F
11/10 13:42, 2F
推
11/10 14:11,
6年前
, 3F
11/10 14:11, 3F
推
11/10 15:12,
6年前
, 4F
11/10 15:12, 4F
→
11/10 15:12,
6年前
, 5F
11/10 15:12, 5F
→
11/10 15:12,
6年前
, 6F
11/10 15:12, 6F
→
11/10 15:14,
6年前
, 7F
11/10 15:14, 7F
→
11/10 15:14,
6年前
, 8F
11/10 15:14, 8F
推
11/10 15:16,
6年前
, 9F
11/10 15:16, 9F
→
11/10 15:16,
6年前
, 10F
11/10 15:16, 10F
推
11/10 15:17,
6年前
, 11F
11/10 15:17, 11F
推
11/10 15:22,
6年前
, 12F
11/10 15:22, 12F
推
11/10 16:47,
6年前
, 13F
11/10 16:47, 13F
→
11/10 16:48,
6年前
, 14F
11/10 16:48, 14F
→
11/10 16:49,
6年前
, 15F
11/10 16:49, 15F
→
11/10 16:49,
6年前
, 16F
11/10 16:49, 16F
→
11/10 16:50,
6年前
, 17F
11/10 16:50, 17F
→
11/10 16:50,
6年前
, 18F
11/10 16:50, 18F
推
11/10 19:24,
6年前
, 19F
11/10 19:24, 19F
推
11/10 21:54,
6年前
, 20F
11/10 21:54, 20F
→
11/10 23:41,
6年前
, 21F
11/10 23:41, 21F
→
11/10 23:42,
6年前
, 22F
11/10 23:42, 22F
推
11/11 00:07,
6年前
, 23F
11/11 00:07, 23F
推
11/11 00:08,
6年前
, 24F
11/11 00:08, 24F
→
11/11 00:08,
6年前
, 25F
11/11 00:08, 25F
推
11/11 04:23,
6年前
, 26F
11/11 04:23, 26F
→
11/11 04:24,
6年前
, 27F
11/11 04:24, 27F
推
11/11 07:57,
6年前
, 28F
11/11 07:57, 28F
推
11/11 14:34,
6年前
, 29F
11/11 14:34, 29F
→
11/11 17:32,
6年前
, 30F
11/11 17:32, 30F
推
11/11 18:53,
6年前
, 31F
11/11 18:53, 31F
→
11/11 18:54,
6年前
, 32F
11/11 18:54, 32F
→
11/11 18:59,
6年前
, 33F
11/11 18:59, 33F
→
11/11 18:59,
6年前
, 34F
11/11 18:59, 34F
→
11/11 19:03,
6年前
, 35F
11/11 19:03, 35F
推
11/11 19:16,
6年前
, 36F
11/11 19:16, 36F
推
11/11 19:17,
6年前
, 37F
11/11 19:17, 37F
推
11/11 19:22,
6年前
, 38F
11/11 19:22, 38F
推
11/11 19:24,
6年前
, 39F
11/11 19:24, 39F
推
11/12 02:56,
6年前
, 40F
11/12 02:56, 40F
→
11/12 02:57,
6年前
, 41F
11/12 02:57, 41F
推
11/12 13:07,
6年前
, 42F
11/12 13:07, 42F
推
11/12 19:44,
6年前
, 43F
11/12 19:44, 43F
→
11/12 19:44,
6年前
, 44F
11/12 19:44, 44F