Re: [爆卦] AlphaGo發現自己79步失誤

看板GO作者 (台灣加油)時間8年前 (2016/03/13 18:53), 編輯推噓17(17016)
留言33則, 18人參與, 最新討論串5/6 (看更多)
※ 引述《tsppajrdrrfs ()》之銘言: : ※ [本文轉錄自 Gossiping 看板 #1MvIov-I ] : 作者: n91324 (不丹) 看板: Gossiping : 標題: [爆卦] AlphaGo發現自己79步失誤 : 時間: Sun Mar 13 17:02:45 2016 : Deep Mind 創辦人在推特表示 : Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87 : 所以AG確實在79有失誤 : 而且她下到87才發現自己之前的失誤 : 補上推特: : 推 OrzJ: https://twitter.com/demishassabis 推特 從這兩個 twitter 來看, AI 在 79 時仍認為自己有 79% 的勝率, 直到第 87 手時,才發現勝率驟降。四日棋迷猜測如下: AI 估計勝率是經由之後的模擬,白 78 手被認為神手,但或許是之後 的巧妙變化是不明顯的,所以 AI 無法知道這手有這麼大的功用,或 是說,無法準確的評估此時的盤面。 要知道,AI 的估算是根據之後的模擬,它並沒有人類邏輯式的推演, 所以它不見得能得到之後的最佳變化。某種意思下,它是取模擬的加權 平均,但只要之後最佳的應對沒被模擬到,它的評估自然不準。又或者 是,最佳應對跟其它應對方的結果差很多,若不能給最佳應對接近 1 的權重,那它的評估就失準。 而隨著棋局變化,又多下了幾手,能變化的地方變少,AI 自然比較能 模擬到正確的應對,才驚覺自己已經落後。 這提供了要對付目前這版 AlphaGo 的方法,你最好下一些方法是:接 下來對你的最佳解跟次佳解,結果會差很多,這樣 AI 用模擬的,就有 機會誤判。如果你下的棋,接下來的應對,結果都差不了太多,那 AI 自然估得準。讓它估不準,才會在接下來還沒估準前,繼續出錯。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.74.113 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457866429.A.E29.html

03/13 18:55, , 1F
AI遇到沒遇過狀況,但這次他就記起來了
03/13 18:55, 1F

03/13 18:56, , 2F
相同的招以後想再用就沒用了
03/13 18:56, 2F

03/13 18:57, , 3F
所以由此可見得黑77手那時,alphaGO的勝算有多大…
03/13 18:57, 3F

03/13 19:00, , 4F
他勝算大是認定他跑的圖都把白吃光了吧,暴動手筋沒算到
03/13 19:00, 4F

03/13 19:01, , 5F
不一定 如果稍微改變幾個棋子 BUG還是存在 因為這是程式阿
03/13 19:01, 5F

03/13 19:01, , 6F
必須根本性解決這問題
03/13 19:01, 6F

03/13 19:01, , 7F
那時候直播的職業棋手幾乎都認為李快要四連敗了
03/13 19:01, 7F

03/13 19:02, , 8F
直到李世石78的神之一手才逆轉大家的看法
03/13 19:02, 8F

03/13 19:05, , 9F
既然有所謂的勝率, 就有被AG認為會敗的招
03/13 19:05, 9F

03/13 19:06, , 10F
AlphaGo不能即時學習
03/13 19:06, 10F

03/13 19:06, , 11F
要重新訓練
03/13 19:06, 11F

03/13 19:07, , 12F
很有可能在78手起連續被打在AG評估會敗的地方導致勝率狂掉
03/13 19:07, 12F

03/13 19:07, , 13F
最好是逆轉...那邊本來就有手段 不只78那個位置
03/13 19:07, 13F

03/13 19:08, , 14F
到87手的時候 AG 發現自己的勝率掉到某個門檻以下
03/13 19:08, 14F

03/13 19:08, , 15F
是逆轉吧 電腦勝率從79%掉 還有職九們覺得李要輸了
03/13 19:08, 15F

03/13 19:08, , 16F
有比挖更好的下法嗎?這一步李世石想了十五分鐘的說
03/13 19:08, 16F

03/13 19:09, , 17F
依照古力和柯潔的下法明明就還差很多
03/13 19:09, 17F

03/13 19:09, , 18F
版上有不世出的高手啊 請賜教
03/13 19:09, 18F

03/13 19:10, , 19F
這手很明顯連alphago也沒算到 不然後面不會崩潰那麼明顯
03/13 19:10, 19F

03/13 19:10, , 20F
78手改下靠的話,結果真的難料...
03/13 19:10, 20F

03/13 19:16, , 21F
AI不能快速從錯誤中學習的確還有一大段路要走
03/13 19:16, 21F

03/13 19:29, , 22F
Alphago之所以有別於以往的圍棋AI就是他能學習成長好嗎
03/13 19:29, 22F

03/13 19:32, , 23F
覺得要逼狗犯無可挽回的大錯有兩個條件
03/13 19:32, 23F

03/13 19:34, , 24F
第一是極佳的妙手,第二是這一手遠超出狗的預期範圍
03/13 19:34, 24F

03/13 19:37, , 25F
李能下出超出預期的這一手真的是很難得,別忘了Alphago
03/13 19:37, 25F

03/13 19:37, , 26F
已經自我對奕超過三千萬盤棋
03/13 19:37, 26F

03/13 19:52, , 27F
其實也有個弔詭的地方, 勝率接近八成 代表還有兩成可破
03/13 19:52, 27F

03/13 19:54, , 28F
說不定2成中就會有像今天這種一下子把勝率壓到很低的走法
03/13 19:54, 28F

03/13 20:10, , 29F
78手確實是手筋
03/13 20:10, 29F

03/13 20:39, , 30F
李也說78手是唯一一手 所以他也知道他那時候勝率有2成
03/13 20:39, 30F

03/13 20:39, , 31F
而2成的勝率就要從這裡突破 他跟alphago想的都一樣
03/13 20:39, 31F

03/13 21:45, , 32F
alphago好像不會記得這幾盤棋
03/13 21:45, 32F

03/13 22:28, , 33F
軟體用的是大數據training 不會去特別對應某種情況
03/13 22:28, 33F
文章代碼(AID): #1MvKQzuf (GO)
討論串 (同標題文章)
文章代碼(AID): #1MvKQzuf (GO)