[情報] 圍棋TV第四局,78手正確應手消失

看板GO作者時間8年前 (2016/03/14 01:01), 8年前編輯推噓33(330266)
留言299則, 17人參與, 最新討論串1/1
http://www.weiqitv.com/index/spec?sid=56e13716d4c36c29248b4567 看影片吧,大概第四集的15:00附近 本來以為敗招是在78出現之前就種下敗因,78之後李斷然大優 但經過影片的解釋,應對得宜的話,敗因便無從爆發了... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.144.97 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457888511.A.1CD.html ※ 編輯: aaaba (111.82.144.97), 03/14/2016 01:04:58

03/14 01:07, , 1F
算不到 78 也就當然不會應對 @@ 如果算到 78...
03/14 01:07, 1F

03/14 01:07, , 2F
根本不會走成這樣 這是雞跟蛋的關係
03/14 01:07, 2F

03/14 01:11, , 3F
不過依阿發狗的紀錄,他是有算到78的,但不是無力應對,
03/14 01:11, 3F

03/14 01:12, , 4F
是應錯了(bug)。
03/14 01:12, 4F

03/14 01:27, , 5F
聽起來好像是可以修正的bug
03/14 01:27, 5F

03/14 01:32, , 6F
不是說評估勝率一直很高? 這樣就是沒算到啊 @@
03/14 01:32, 6F

03/14 01:33, , 7F
重點是知道阿法狗會下錯的就夠了,這樣人類心理壓力就沒
03/14 01:33, 7F

03/14 01:35, , 8F
這種等級的錯誤心裡總不踏實(只比日本將棋好一點, 那個
03/14 01:35, 8F

03/14 01:35, , 9F
是賽前測試發現 bug 拿著當寶, 這樣贏棋又可以拖過一年)
03/14 01:35, 9F

03/14 01:38, , 10F
沒算到的話,78一出勝率評估會大降,而非等到八十幾手才注意
03/14 01:38, 10F

03/14 01:38, , 11F
03/14 01:38, 11F

03/14 01:39, , 12F
都說了是沒算到為何會降? 到八十幾手才算進變化哩
03/14 01:39, 12F

03/14 01:40, , 13F
這代表評估網路對於當時的局面沒有認識 純靠MCTS就很弱
03/14 01:40, 13F

03/14 01:40, , 14F
調整時間分配或許會有幫助 但是這也很難由程式自行發現
03/14 01:40, 14F

03/14 01:46, , 15F
78落子後,這步都擺在棋盤上了,總該算一算了吧,
03/14 01:46, 15F

03/14 01:48, , 16F
是有算到喔,若沒算到,78後的勝率(79)就不會是70%。
03/14 01:48, 16F

03/14 01:48, , 17F
算到但算錯的可能性比較高,所以才會在已經下下去了卻還認
03/14 01:48, 17F

03/14 01:48, , 18F
是價值網絡讓79的判斷出了問題。
03/14 01:48, 18F

03/14 01:48, , 19F
為自己優勢。
03/14 01:48, 19F

03/14 01:49, , 20F
如果認為有算到, 為什麼還會是 70%?
03/14 01:49, 20F

03/14 01:49, , 21F
被對方佔到應該已經虧到脫褲子了不是嗎?
03/14 01:49, 21F

03/14 01:50, , 22F
所以說是「算錯」啊,這一手算到了,但對之後的變化評分算
03/14 01:50, 22F

03/14 01:50, , 23F
錯,因而覺得被下到這一手也沒關係還是勝率高
03/14 01:50, 23F

03/14 01:51, , 24F
阿就電腦錯覺以為自己可對付那招
03/14 01:51, 24F

03/14 01:51, , 25F
直到發展了幾手,評估網路也跟算到更遠一點的變化後,才發
03/14 01:51, 25F

03/14 01:51, , 26F
有算但算錯了,所以才說是有bug啊(本不應算錯)
03/14 01:51, 26F

03/14 01:51, , 27F
那就不是"算到"啊... 如果真算到 MCTS 會排在前面
03/14 01:51, 27F

03/14 01:51, , 28F
現後面多手攻殺後其實要糟的,此時勝率才驟降
03/14 01:51, 28F

03/14 01:51, , 29F
真的算下去就會發現一定大虧, 分數肯定低到不行
03/14 01:51, 29F

03/14 01:52, , 30F
個人認知這個"勝率"應該是MCTS計算結果才對
03/14 01:52, 30F

03/14 01:52, , 31F
你把「算到」定義成連後面所有變化全算清了,我們的「算到
03/14 01:52, 31F

03/14 01:52, , 32F
」只是指它有評估到這一手的分數,但這個分數錯了
03/14 01:52, 32F

03/14 01:52, , 33F
78手不錯 但其實不像是可以翻盤的一手 AlphaGO有很
03/14 01:52, 33F

03/14 01:52, , 34F
這是原理的問題, MCTS 依照評估的結果決定棋步的重要性
03/14 01:52, 34F

03/14 01:53, , 35F
多 不只一條選擇
03/14 01:53, 35F

03/14 01:53, , 36F
評估分數當然是錯了 那就是沒算到啊 @@
03/14 01:53, 36F

03/14 01:53, , 37F
不然每個棋步都有一個分數 哪裡有沒算到的
03/14 01:53, 37F

03/14 01:53, , 38F
而分數錯正是因為它沒有有算清,這種情況我會用「算到但算
03/14 01:53, 38F

03/14 01:53, , 39F
錯」來講,也許這就是你口中的「沒算到」,我想只是用詞差
03/14 01:53, 39F
還有 220 則推文
03/14 06:40, , 260F
這裡AlphaGo不是只有value net,還有rollout會一路模擬
03/14 06:40, 260F

03/14 06:40, , 261F
到完。我的『走過』單指value net有評估過。
03/14 06:40, 261F

03/14 06:40, , 262F
大家也同意在78步之後的變化(死活棋?)AlphaGo評估得並
03/14 06:40, 262F

03/14 06:40, , 263F
不好,這個就有兩種:value net給的value不好以至於MC
03/14 06:40, 263F

03/14 06:40, , 264F
tree大部分時間在展開不重要的分支,或者rollout下的不
03/14 06:40, 264F

03/14 06:40, , 265F
好以至於就算展開了重要的分支,但是展開的不夠深而
03/14 06:40, 265F

03/14 06:40, , 266F
rollout接手後也無法算對。
03/14 06:40, 266F

03/14 06:40, , 267F
以勝率來看,似乎AlphaGo本來覺得上方死活棋是贏的。
03/14 06:40, 267F

03/14 06:40, , 268F
哲學上可以說AlphaGo在78手還未發生時就算錯了,但
03/14 06:40, 268F

03/14 06:40, , 269F
李九段沒有下78手這個錯誤可能就會被修正。從這觀點來
03/14 06:40, 269F

03/14 06:40, , 270F
說,我自己是得到跟李九段不同的結論:不是遇到未預期
03/14 06:40, 270F

03/14 06:40, , 271F
的一手會變弱,而是在複雜的計算情形裡藏有弱點。
03/14 06:40, 271F

03/14 06:40, , 272F
我的判斷跟李九段不同想來表示我有想錯,如果有圍棋高
03/14 06:40, 272F

03/14 06:40, , 273F
手願意指出我也不勝感激XD
03/14 06:40, 273F

03/14 06:42, , 274F
啊我又用錯詞了,我講的value net還要包括SL policy
03/14 06:42, 274F

03/14 06:55, , 275F
重看了一下轉播,在6:08:00左右有李九段的回答,
03/14 06:55, 275F

03/14 06:56, , 276F
從英文來說也可以解釋成是78手會觸發AG的犯錯..
03/14 06:56, 276F

03/14 06:57, , 277F
(英文轉播沒提到78手,只是說『意料外的棋步』)
03/14 06:57, 277F

03/14 07:20, , 278F
人打電腦本來就要用不同的邏輯,人和人比賽,比策略比細
03/14 07:20, 278F

03/14 07:20, , 279F
算比心裡素質,跟機器比賽只要找出他的盲點(bug),感覺
03/14 07:20, 279F

03/14 07:20, , 280F
上李世石就是google請的程式測試人員罷了,而不是在下棋
03/14 07:20, 280F

03/14 07:20, , 281F
03/14 07:20, 281F

03/14 07:24, , 282F
Twitter好像有說79手時AG還評斷有70%up的勝率 有沒有可能
03/14 07:24, 282F

03/14 07:25, , 283F
但這個bug是很難觸發的: 最無趣的解釋是李九段運氣特好
03/14 07:25, 283F

03/14 07:25, , 284F
就是後面漂亮的走到那20%的棋?
03/14 07:25, 284F

03/14 07:27, , 285F
但是官方說法說85手還是相信差不多的勝率,似乎嚴重誤判
03/14 07:27, 285F

03/14 07:29, , 286F
如果相信Google Deepmind自己測試時沒有輕敵偷懶,那麼
03/14 07:29, 286F

03/14 07:29, , 287F
AlphaGo的問題 (1) 跟業餘高段的黃世傑下讓子沒辦法觸發
03/14 07:29, 287F

03/14 07:29, , 288F
78之後對人用棋理解可能不是超難 可是對MCTS說不定勝率還
03/14 07:29, 288F

03/14 07:30, , 289F
(2) 用AlphaGo自己跟自己對奕也沒辦法觸發
03/14 07:30, 289F

03/14 07:30, , 290F
(3) 用圍棋界的經典名局讓AlphaGo中途開始也沒辦法觸發
03/14 07:30, 290F

03/14 07:32, , 291F
是高的 可能要收束到87手MCTS才能判定裡那裏不會錯子(進到
03/14 07:32, 291F

03/14 07:32, , 292F
另外80%的變化)?
03/14 07:32, 292F

03/14 07:33, , 293F
就是說AlphaGo在前三盤展現出的判斷力跟這次79~87不符XD
03/14 07:33, 293F

03/14 07:34, , 294F
我覺得AG自己對弈可能有觸發到 只是觸發到的機率很低被它
03/14 07:34, 294F

03/14 07:35, , 295F
判定不用管 畢竟AG的"勝率" 跟人類的"形式判斷"的勝率不同
03/14 07:35, 295F

03/14 07:36, , 296F
嗯MicroB你說的對,我應該說不容易記錄下來被工程師研究
03/14 07:36, 296F

03/14 07:38, , 297F
就是說我相信黃世傑本人肯定看了AlphaGo左右互搏很多次
03/14 07:38, 297F

03/14 07:39, , 298F
,不管作為工程師或作為棋手都是吧 :p 所以...
03/14 07:39, 298F

03/14 13:56, , 299F
darkseer大,大中肯。
03/14 13:56, 299F
文章代碼(AID): #1MvPp_7D (GO)