Re: [爆卦] AlphaGo發現自己79步失誤
※ 引述《tsppajrdrrfs ()》之銘言:
: ※ [本文轉錄自 Gossiping 看板 #1MvIov-I ]
: 作者: n91324 (不丹) 看板: Gossiping
: 標題: [爆卦] AlphaGo發現自己79步失誤
: 時間: Sun Mar 13 17:02:45 2016
: Deep Mind 創辦人在推特表示
: Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87
: 所以AG確實在79有失誤
: 而且她下到87才發現自己之前的失誤
: 補上推特:
: 推 OrzJ: https://twitter.com/demishassabis 推特
從這兩個 twitter 來看, AI 在 79 時仍認為自己有 79% 的勝率,
直到第 87 手時,才發現勝率驟降。四日棋迷猜測如下:
AI 估計勝率是經由之後的模擬,白 78 手被認為神手,但或許是之後
的巧妙變化是不明顯的,所以 AI 無法知道這手有這麼大的功用,或
是說,無法準確的評估此時的盤面。
要知道,AI 的估算是根據之後的模擬,它並沒有人類邏輯式的推演,
所以它不見得能得到之後的最佳變化。某種意思下,它是取模擬的加權
平均,但只要之後最佳的應對沒被模擬到,它的評估自然不準。又或者
是,最佳應對跟其它應對方的結果差很多,若不能給最佳應對接近 1
的權重,那它的評估就失準。
而隨著棋局變化,又多下了幾手,能變化的地方變少,AI 自然比較能
模擬到正確的應對,才驚覺自己已經落後。
這提供了要對付目前這版 AlphaGo 的方法,你最好下一些方法是:接
下來對你的最佳解跟次佳解,結果會差很多,這樣 AI 用模擬的,就有
機會誤判。如果你下的棋,接下來的應對,結果都差不了太多,那 AI
自然估得準。讓它估不準,才會在接下來還沒估準前,繼續出錯。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.74.113
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457866429.A.E29.html
→
03/13 18:55, , 1F
03/13 18:55, 1F
→
03/13 18:56, , 2F
03/13 18:56, 2F
推
03/13 18:57, , 3F
03/13 18:57, 3F
→
03/13 19:00, , 4F
03/13 19:00, 4F
推
03/13 19:01, , 5F
03/13 19:01, 5F
→
03/13 19:01, , 6F
03/13 19:01, 6F
推
03/13 19:01, , 7F
03/13 19:01, 7F
→
03/13 19:02, , 8F
03/13 19:02, 8F
推
03/13 19:05, , 9F
03/13 19:05, 9F
推
03/13 19:06, , 10F
03/13 19:06, 10F
→
03/13 19:06, , 11F
03/13 19:06, 11F
→
03/13 19:07, , 12F
03/13 19:07, 12F
推
03/13 19:07, , 13F
03/13 19:07, 13F
→
03/13 19:08, , 14F
03/13 19:08, 14F
推
03/13 19:08, , 15F
03/13 19:08, 15F
推
03/13 19:08, , 16F
03/13 19:08, 16F
→
03/13 19:09, , 17F
03/13 19:09, 17F
→
03/13 19:09, , 18F
03/13 19:09, 18F
推
03/13 19:10, , 19F
03/13 19:10, 19F
推
03/13 19:10, , 20F
03/13 19:10, 20F
推
03/13 19:16, , 21F
03/13 19:16, 21F
推
03/13 19:29, , 22F
03/13 19:29, 22F
推
03/13 19:32, , 23F
03/13 19:32, 23F
→
03/13 19:34, , 24F
03/13 19:34, 24F
推
03/13 19:37, , 25F
03/13 19:37, 25F
→
03/13 19:37, , 26F
03/13 19:37, 26F
→
03/13 19:52, , 27F
03/13 19:52, 27F
→
03/13 19:54, , 28F
03/13 19:54, 28F
推
03/13 20:10, , 29F
03/13 20:10, 29F
推
03/13 20:39, , 30F
03/13 20:39, 30F
→
03/13 20:39, , 31F
03/13 20:39, 31F
→
03/13 21:45, , 32F
03/13 21:45, 32F
推
03/13 22:28, , 33F
03/13 22:28, 33F
討論串 (同標題文章)