[討論] 阿發狗要繁殖小baby了？消失

看板GO作者aaaba時間8年前 (2016/03/12 16:38)推噓16(16推 0噓 23→)

留言39則, 14人參與討論串1/1

跟樊麾下的阿發狗是吃KGS的棋譜長大的後來跟小李下的時候，大概是吃了職棋的正式對局譜，又變得更猛前兩階段可以說是以人的心血餵養長大的，還有點血脈相承的親切感但剛剛聽柯潔那台的棋評提到接下來會把人的影子都清洗淡化，也就是純粹的用阿發狗自己對局的棋譜來重學下棋這種完完全全丟掉初始資料的學習方式個人是第一次聽聞（相較於後續只是接著 fine-tuning 的作法）有夠變態！不知道有沒有人可以找到資料來源？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.190.215 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457771882.A.B29.html

推

03/12 16:40, , 1^F

03/12 16:40, 1^F

推

03/12 16:42, , 2^F

03/12 16:42, 2^F

推

03/12 16:43, , 3^F

03/12 16:43, 3^F

推

03/12 16:44, , 4^F

03/12 16:44, 4^F

→

03/12 16:45, , 5^F

03/12 16:45, 5^F

感謝提供來源另外，這個 D. Silver 有提到另一個驚人內幕，第二局的五路肩冲在 policy network 的機率只有萬分之一，太狂了!哪個人類有辦法去考慮機率只有萬分之一的分支

推

03/12 16:45, , 6^F

03/12 16:45, 6^F

推

03/12 16:46, , 7^F

03/12 16:46, 7^F

推

03/12 16:46, , 8^F

03/12 16:46, 8^F

→

03/12 16:46, , 9^F

03/12 16:46, 9^F

→

03/12 16:46, , 10^F

03/12 16:46, 10^F

→

03/12 16:47, , 11^F

03/12 16:47, 11^F

→

03/12 16:47, , 12^F

03/12 16:47, 12^F

→

03/12 16:48, , 13^F

03/12 16:48, 13^F

個人認為，原來SL的雜訊來源之一，可能類似這個例子：兩個九段對弈，在第80手，A明顯優勢，可是收官時A打了個大勺，B贏了於是，你拿 (80手的盤面，B勝) 這樣一筆資料來給阿發狗學習判斷勝率，可能帶來負面的影響。因此，純阿發狗的棋譜若不打勺，就可以避開此類干擾學習的“雜訊”

推

03/12 16:49, , 14^F

03/12 16:49, 14^F

推

03/12 16:53, , 15^F

03/12 16:53, 15^F

推

03/12 17:11, , 16^F

03/12 17:11, 16^F

→

03/12 17:12, , 17^F

03/12 17:12, 17^F

推

03/12 17:16, , 18^F

03/12 17:16, 18^F

→

03/12 17:17, , 19^F

03/12 17:17, 19^F

→

03/12 17:18, , 20^F

03/12 17:18, 20^F

→

03/12 17:18, , 21^F

03/12 17:18, 21^F

→

03/12 17:18, , 22^F

03/12 17:18, 22^F

→

03/12 17:18, , 23^F

03/12 17:18, 23^F

→

03/12 17:19, , 24^F

03/12 17:19, 24^F

我上面的例子是對value network而言，你這段是policy network，在做了RL後，對於下一手的選點比較集中幾個點，而不做RL之前選點是比較廣泛，跟mcts搭配起來有微妙差異，好壞就要透過實證來下結論。

→

03/12 17:20, , 25^F

03/12 17:20, 25^F

→

03/12 17:20, , 26^F

03/12 17:20, 26^F

推

03/12 17:34, , 27^F

03/12 17:34, 27^F

→

03/12 17:35, , 28^F

03/12 17:35, 28^F

→

03/12 17:35, , 29^F

03/12 17:35, 29^F

→

03/12 17:37, , 30^F

03/12 17:37, 30^F

→

03/12 17:37, , 31^F

03/12 17:37, 31^F

推

03/12 18:01, , 32^F

03/12 18:01, 32^F

推

03/12 18:29, , 33^F

03/12 18:29, 33^F

→

03/12 18:30, , 34^F

03/12 18:30, 34^F

→

03/12 18:30, , 35^F

03/12 18:30, 35^F

→

03/12 18:31, , 36^F

03/12 18:31, 36^F

※ 編輯: aaaba (111.82.190.216), 03/12/2016 20:00:11

推

03/12 20:19, , 37^F

03/12 20:19, 37^F

推

03/12 21:35, , 38^F

03/12 21:35, 38^F

→

03/12 21:35, , 39^F

03/12 21:35, 39^F

‣ 返回看板[ GO ] 棋類

‣ 更多 aaaba 的文章

文章代碼(AID): #1MuzLgif (GO)