Re: [爆卦] AlphaGo發現自己79步失誤

看板GO作者時間8年前 (2016/03/13 17:22), 8年前編輯推噓9(9029)
留言38則, 19人參與, 最新討論串3/6 (看更多)
Demis Hassabis推特:(Deepmind 創辦人&CEO, 以下翻譯差勿怪) https://twitter.com/demishassabis 兩小時前: 李世石下得很好!AlphaGo本來認為自己下得很好,但在87手迷惑了。 我們現在有麻煩了... 一小時前: 錯誤發生在第79手,但AlphaGo到87手才意識到這點。 (按: 自然地想跟78手有些關係,不過這裡沒有說明) 43分鐘前: 我的『認為』和『意識』,我指的是AlphaGo的價值網路(value net)的回報, 在79手時回報勝率是70%,但到87手就沉下去了。 34分鐘前: 李世石贏了!! 恭喜,他今天對我們太好了。壓迫了AlphaGo讓它犯出大錯。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 192.16.204.74 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457860979.A.ABF.html

03/13 17:23, , 1F
他的評價網路
03/13 17:23, 1F

03/13 17:25, , 2F
deepmind的好消息 google仍要繼續投資
03/13 17:25, 2F

03/13 17:26, , 3F
如果他的蒙特卡羅搜尋跟決策網路要這麼多手後才能得到評
03/13 17:26, 3F

03/13 17:26, , 4F
價網路的反饋
03/13 17:26, 4F

03/13 17:26, , 5F
李只是鬆口氣
03/13 17:26, 5F
※ 編輯: darkseer (192.16.204.74), 03/13/2016 17:29:31

03/13 17:27, , 6F
不太可能 所以就不懂為什麼到87手才反饋
03/13 17:27, 6F

03/13 17:29, , 7F
到79時就應該降低了 但到87才直線下降 顯然是有bug
03/13 17:29, 7F

03/13 17:30, , 8F
AlphaGO這問題頗大 不好解決
03/13 17:30, 8F

03/13 17:31, , 9F
我自己會猜是缺乏某種很特定的能力,或者說在某個特定
03/13 17:31, 9F

03/13 17:31, , 10F
這不是好事嗎?本來就是要測出bug阿
03/13 17:31, 10F

03/13 17:31, , 11F
他是看勝率 79手有70% 87手開始降 所以狗算不出10手後阿
03/13 17:31, 11F

03/13 17:31, , 12F
狀況會有誤判。圍棋高手猜測是什麼種類的誤判呢XD?
03/13 17:31, 12F

03/13 17:32, , 13F
有時棋勢會在剛下時沒啥變化 在後面幾手才會突顯出來
03/13 17:32, 13F

03/13 17:33, , 14F
AI不是窮舉,就是79~87內容不在他計算發展內而已
03/13 17:33, 14F

03/13 17:34, , 15F
感覺是那一手電腦沒投入太多計算,所以認為勝率很差
03/13 17:34, 15F

03/13 17:35, , 16F
等到87手發現勝率降低,開始投入計算研究前面幾手
03/13 17:35, 16F

03/13 17:35, , 17F
才發現其實那一手其實是好手,可是來不及了
03/13 17:35, 17F

03/13 17:38, , 18F
李成功抓蟲
03/13 17:38, 18F
※ 編輯: darkseer (192.16.204.74), 03/13/2016 17:42:05

03/13 17:42, , 19F
MCTS其實是去模擬電腦覺得比較有可能的下法
03/13 17:42, 19F

03/13 17:42, , 20F
問問題,對於78手,職業棋士認為79是壞手嗎?
03/13 17:42, 20F

03/13 17:42, , 21F
所以合理推斷應該是先前AlphaGo沒有算到78手
03/13 17:42, 21F

03/13 17:46, , 22F
應該是電腦看棋盤不是我們的角度,它認為79步是好棋
03/13 17:46, 22F

03/13 17:46, , 23F
阿發狗 下班別偷看統神台阿 真的變87了
03/13 17:46, 23F
※ 編輯: darkseer (192.16.204.74), 03/13/2016 17:48:02

03/13 17:57, , 24F
其實不知道說79手失誤是AlphaGo自己發現,還是團隊發現
03/13 17:57, 24F

03/13 17:58, , 25F
如果是前者,那聽起來比較像是在說AG也覺得78是超好手,
03/13 17:58, 25F

03/13 17:58, , 26F
如果是後者,那也許就是79手本身也有相當問題@@
03/13 17:58, 26F

03/13 17:59, , 27F
團隊沒這棋力發現 應該是alphago自己回饋的
03/13 17:59, 27F

03/13 18:03, , 28F
噢我是說團隊可能用AG為基礎另外做了一套分析程式之類
03/13 18:03, 28F

03/13 18:04, , 29F
一個猜想, 或許是AlphaGo發現在79手之後, 被對方連續幾手
03/13 18:04, 29F

03/13 18:05, , 30F
下在他判斷會輸的那一邊,然後自己的勝率狂掉,到87無力回天
03/13 18:05, 30F

03/13 18:12, , 31F
我記得79手不算太大的失誤吧 是後面到左下挖那一手才
03/13 18:12, 31F

03/13 18:13, , 32F
算吧 還有右邊那個立下
03/13 18:13, 32F

03/13 18:16, , 33F
嗯,我用語不準確,應該說AG可能自己認為79有相當問題
03/13 18:16, 33F

03/13 18:18, , 34F
如果78成立勝負手,那問題只會出現在78手之前
03/13 18:18, 34F

03/13 18:20, , 35F
因為不該下成能讓小李下出78手的局面...前因才是關鍵
03/13 18:20, 35F

03/13 18:23, , 36F
嗯,可能代表AlphaGo一直沒有意識到78手,所以這樣判斷
03/13 18:23, 36F

03/13 19:19, , 37F
也許ag判斷78其實是有應對的?
03/13 19:19, 37F

03/13 19:22, , 38F
顯然是計算的時候就漏了這支 如果有應對早就下出來了 XD
03/13 19:22, 38F
※ 編輯: darkseer (192.16.204.74), 03/14/2016 09:23:19
文章代碼(AID): #1MvJ5pg_ (GO)
討論串 (同標題文章)
文章代碼(AID): #1MvJ5pg_ (GO)