Re: [爆卦] AlphaGo發現自己79步失誤
※ 引述《tlchen (台灣加油)》之銘言:
: 從這兩個 twitter 來看, AI 在 79 時仍認為自己有 79% 的勝率,
: 直到第 87 手時,才發現勝率驟降。四日棋迷猜測如下:
: AI 估計勝率是經由之後的模擬,白 78 手被認為神手,但或許是之後
: 的巧妙變化是不明顯的,所以 AI 無法知道這手有這麼大的功用,或
: 是說,無法準確的評估此時的盤面。
value network 是給一個盤面 (361 個輸入黑/白/空) 直接告訴你勝率.
基本上盤面幾乎不會重複, 所以每一個盤面都是 AlphaGo 或人沒看過的.
如果是人, 中盤之後可能會開始點空估計目數.
而估錯最可能發生在以為的活棋其實是死棋, 比如說進行中的攻殺.
value network 是餵給它千萬盤面, 然後跟它說最後是贏是輸訓練出來.
遇到新的盤面, value network 根據之前的經驗 (神經連結權重) 吐出結果.
如果單純餵 "361 個輸入黑/白/空" 進去訓練一定完蛋,
因為這樣變成單純的形態學, 長得像某個樣子就以為會輸或會贏.
圍棋很多時候差一路就差很多 (好手的旁邊常是惡手)
所以還會加入 "剩下的氣數" "提子數" "手順" "征子" 等等資訊進去訓練.
如果人類認為 79 手的盤勢黑棋大劣了, 那麼 79 手的盤面 value network
就應該吐勝率陡降的值出來, 而不是等到 87 手的盤面才反應.
如果 AlphaGo 知道 79 手 (甚至更早) 的盤面劣勢, 前幾手就會避免走上這個局面.
但到 87 手才知道劣勢, 這時候已經走上不歸路.
AlphaGo 團隊回去一定是在研究這種盤面為什麼會估錯, 以及要如何調整訓練方式.
: 這提供了要對付目前這版 AlphaGo 的方法,你最好下一些方法是:接
: 下來對你的最佳解跟次佳解,結果會差很多,這樣 AI 用模擬的,就有
: 機會誤判。如果你下的棋,接下來的應對,結果都差不了太多,那 AI
: 自然估得準。讓它估不準,才會在接下來還沒估準前,繼續出錯。
這真的要拼 AlphaGo 形勢判斷錯誤.
但是我們不知道甚麼樣的盤面可以讓 AlphaGo 形勢判斷錯誤, 劣勢誤以為優勢.
也許是大規模攻殺, 然後又走進特定的棋型 (像小李今天那一手) 讓它誤判.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.113.64
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457869987.A.DFB.html
→
03/13 19:55, , 1F
03/13 19:55, 1F
→
03/13 19:57, , 2F
03/13 19:57, 2F
推
03/13 19:58, , 3F
03/13 19:58, 3F
→
03/13 19:58, , 4F
03/13 19:58, 4F
→
03/13 19:59, , 5F
03/13 19:59, 5F
推
03/13 19:59, , 6F
03/13 19:59, 6F
推
03/13 19:59, , 7F
03/13 19:59, 7F
推
03/13 19:59, , 8F
03/13 19:59, 8F
→
03/13 20:00, , 9F
03/13 20:00, 9F
推
03/13 20:03, , 10F
03/13 20:03, 10F
→
03/13 20:04, , 11F
03/13 20:04, 11F
→
03/13 20:05, , 12F
03/13 20:05, 12F
推
03/13 20:05, , 13F
03/13 20:05, 13F
推
03/13 20:05, , 14F
03/13 20:05, 14F
→
03/13 20:06, , 15F
03/13 20:06, 15F
→
03/13 20:06, , 16F
03/13 20:06, 16F
→
03/13 20:06, , 17F
03/13 20:06, 17F
→
03/13 20:06, , 18F
03/13 20:06, 18F
→
03/13 20:06, , 19F
03/13 20:06, 19F
→
03/13 20:06, , 20F
03/13 20:06, 20F
→
03/13 20:07, , 21F
03/13 20:07, 21F
→
03/13 20:07, , 22F
03/13 20:07, 22F
→
03/13 20:08, , 23F
03/13 20:08, 23F
→
03/13 20:08, , 24F
03/13 20:08, 24F
→
03/13 20:09, , 25F
03/13 20:09, 25F
→
03/13 20:09, , 26F
03/13 20:09, 26F
→
03/13 20:09, , 27F
03/13 20:09, 27F
→
03/13 20:09, , 28F
03/13 20:09, 28F
→
03/13 20:10, , 29F
03/13 20:10, 29F
→
03/13 20:10, , 30F
03/13 20:10, 30F
→
03/13 20:10, , 31F
03/13 20:10, 31F
→
03/13 20:11, , 32F
03/13 20:11, 32F
→
03/13 20:11, , 33F
03/13 20:11, 33F
→
03/13 20:11, , 34F
03/13 20:11, 34F
→
03/13 20:12, , 35F
03/13 20:12, 35F
→
03/13 20:12, , 36F
03/13 20:12, 36F
→
03/13 20:12, , 37F
03/13 20:12, 37F
→
03/13 20:12, , 38F
03/13 20:12, 38F
→
03/13 20:13, , 39F
03/13 20:13, 39F
推
03/13 20:16, , 40F
03/13 20:16, 40F
→
03/13 20:30, , 41F
03/13 20:30, 41F
→
03/13 20:31, , 42F
03/13 20:31, 42F
推
03/13 20:31, , 43F
03/13 20:31, 43F
→
03/13 20:32, , 44F
03/13 20:32, 44F
→
03/13 20:33, , 45F
03/13 20:33, 45F
→
03/13 20:34, , 46F
03/13 20:34, 46F
→
03/13 20:36, , 47F
03/13 20:36, 47F
→
03/13 20:36, , 48F
03/13 20:36, 48F
推
03/13 20:40, , 49F
03/13 20:40, 49F
→
03/13 20:40, , 50F
03/13 20:40, 50F
→
03/13 20:42, , 51F
03/13 20:42, 51F
推
03/13 20:55, , 52F
03/13 20:55, 52F
→
03/13 21:11, , 53F
03/13 21:11, 53F
→
03/13 21:12, , 54F
03/13 21:12, 54F
→
03/13 21:13, , 55F
03/13 21:13, 55F
→
03/13 21:13, , 56F
03/13 21:13, 56F
→
03/13 21:13, , 57F
03/13 21:13, 57F
→
03/13 21:14, , 58F
03/13 21:14, 58F
→
03/13 21:14, , 59F
03/13 21:14, 59F
推
03/13 21:56, , 60F
03/13 21:56, 60F
推
03/13 22:15, , 61F
03/13 22:15, 61F
→
03/13 22:16, , 62F
03/13 22:16, 62F
→
03/13 22:16, , 63F
03/13 22:16, 63F
推
03/13 23:59, , 64F
03/13 23:59, 64F
→
03/14 00:01, , 65F
03/14 00:01, 65F
→
03/14 00:04, , 66F
03/14 00:04, 66F
→
03/14 00:05, , 67F
03/14 00:05, 67F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 6 之 6 篇):