Re: [爆卦] AlphaGo發現自己79步失誤

看板GO作者 (shantotto)時間8年前 (2016/03/13 18:13), 編輯推噓8(809)
留言17則, 10人參與, 最新討論串4/6 (看更多)
※ 引述《darkseer ()》之銘言: : Demis Hassabis推特:(Deepmind 創辦人&CEO, 以下翻譯差勿怪) : https://twitter.com/demishassabis : 兩小時前: 李世石下得很好!AlphaGo本來認為自己下得很好,但在87手迷惑了。 : 我們現在有麻煩了... : 一小時前: 錯誤發生在第79手,但AlphaGo到87手才意識到這點。 : (按: 自然地想跟78手有些關係,不過這裡沒有說明) : 43分鐘前: 我的『認為』和『意識』,我指的是AlphaGo的價值網路value net, : 在79手時認為勝率是70%,但到87手就沉下去了。 : (按: 原文只說value net,不清楚是簡稱還是具體單指value network) : 34分鐘前: 李世石贏了!! 恭喜,他對我們很好的壓迫AlphaGo讓它犯出大錯。 他的意思可能是 AlphaGo 對於 79~86 手之間的盤面 value network 還是評估自己勝算很高, 但在 87 手突然掉下去. value network (形勢判斷) 訓練出來的值有問題. 應該要更早幾手吐出勝算低的值, 才能避免往這種變化下. 79 是不是敗著不知道, 因為可能 78 一下黑棋就討不了好, 那麼敗著還要再往前推幾手. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.113.64 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457864034.A.537.html

03/13 18:15, , 1F
是的,如果78是小李的逆轉手,那問題肯定出現在更早之前
03/13 18:15, 1F

03/13 18:17, , 2F
敗著應該是83,右邊不要動直接處理中間應該勝負還未知
03/13 18:17, 2F

03/13 18:18, , 3F
是不是小李大馬步飛出來 跑去右邊肩衝那一棋?
03/13 18:18, 3F

03/13 18:18, , 4F
再往前推的話可能就69直接下71位就不會有這些後續了
03/13 18:18, 4F

03/13 18:19, , 5F
這狀況代表的通常是這招從來沒看過 評估的時候當然漏了
03/13 18:19, 5F

03/13 18:20, , 6F
電腦優勢時會縮小棋盤減少變化.所以形勢判斷很重要
03/13 18:20, 6F

03/13 18:25, , 7F
這篇的理解應該是正確的。形勢判斷部分的策略邏輯應該有
03/13 18:25, 7F

03/13 18:25, , 8F
問題。
03/13 18:25, 8F

03/13 18:37, , 9F
我覺得跟被吃子有關 因為子一被吃
03/13 18:37, 9F

03/13 18:37, , 10F
盤面就改變了
03/13 18:37, 10F

03/13 18:39, , 11F
跟被吃子應該無關,因為AG會重新估算盤面。
03/13 18:39, 11F

03/13 18:51, , 12F
看起來勝率陡降是個很好的抓 debug 方式
03/13 18:51, 12F

03/13 18:51, , 13F
推,不過我對於value network是不是該稱為形勢判斷
03/13 18:51, 13F

03/13 18:52, , 14F
有些疑義XD 畢竟形式判斷是個圍棋詞語?
03/13 18:52, 14F

03/13 19:37, , 15F
會驚呼的原因是 79手後黑選擇打劫仍然是占優的局面
03/13 19:37, 15F

03/13 19:38, , 16F
但是黑選擇放棄打劫 卻又下出一連串自損的下法
03/13 19:38, 16F

03/13 19:38, , 17F
直接導致局面翻轉
03/13 19:38, 17F
文章代碼(AID): #1MvJrYKt (GO)
討論串 (同標題文章)
文章代碼(AID): #1MvJrYKt (GO)