Re: [爆卦] AlphaGo發現自己79步失誤
※ 引述《darkseer ()》之銘言:
: Demis Hassabis推特:(Deepmind 創辦人&CEO, 以下翻譯差勿怪)
: https://twitter.com/demishassabis
: 兩小時前: 李世石下得很好!AlphaGo本來認為自己下得很好,但在87手迷惑了。
: 我們現在有麻煩了...
: 一小時前: 錯誤發生在第79手,但AlphaGo到87手才意識到這點。
: (按: 自然地想跟78手有些關係,不過這裡沒有說明)
: 43分鐘前: 我的『認為』和『意識』,我指的是AlphaGo的價值網路value net,
: 在79手時認為勝率是70%,但到87手就沉下去了。
: (按: 原文只說value net,不清楚是簡稱還是具體單指value network)
: 34分鐘前: 李世石贏了!! 恭喜,他對我們很好的壓迫AlphaGo讓它犯出大錯。
他的意思可能是 AlphaGo 對於 79~86 手之間的盤面
value network 還是評估自己勝算很高, 但在 87 手突然掉下去.
value network (形勢判斷) 訓練出來的值有問題.
應該要更早幾手吐出勝算低的值, 才能避免往這種變化下.
79 是不是敗著不知道, 因為可能 78 一下黑棋就討不了好,
那麼敗著還要再往前推幾手.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.113.64
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457864034.A.537.html
推
03/13 18:15, , 1F
03/13 18:15, 1F
推
03/13 18:17, , 2F
03/13 18:17, 2F
→
03/13 18:18, , 3F
03/13 18:18, 3F
→
03/13 18:18, , 4F
03/13 18:18, 4F
推
03/13 18:19, , 5F
03/13 18:19, 5F
推
03/13 18:20, , 6F
03/13 18:20, 6F
推
03/13 18:25, , 7F
03/13 18:25, 7F
→
03/13 18:25, , 8F
03/13 18:25, 8F
推
03/13 18:37, , 9F
03/13 18:37, 9F
→
03/13 18:37, , 10F
03/13 18:37, 10F
→
03/13 18:39, , 11F
03/13 18:39, 11F
→
03/13 18:51, , 12F
03/13 18:51, 12F
推
03/13 18:51, , 13F
03/13 18:51, 13F
→
03/13 18:52, , 14F
03/13 18:52, 14F
推
03/13 19:37, , 15F
03/13 19:37, 15F
→
03/13 19:38, , 16F
03/13 19:38, 16F
→
03/13 19:38, , 17F
03/13 19:38, 17F
討論串 (同標題文章)
完整討論串 (本文為第 4 之 6 篇):