Re: [問題] 可否更改alphago的設定

看板GO作者 (-Bingo!-)時間8年前 (2016/03/11 14:04), 編輯推噓8(8033)
留言41則, 16人參與, 最新討論串3/4 (看更多)
講一下我對AlphaGo"迴避打劫"的看法 不是AlphaGo不會打劫,而是打劫這個行為對AlphaGo來說,是一個比較"麻煩"的事情 不是指打劫對AlphaGo來說很難,而是它會造成圍棋一個無解的情形:循環盤面 要做出循環盤面很簡單,只要有三個半劫就可以了,圍棋規則規定劫不可馬上回提, 必須隔一手再提,然而三個劫黑白互相回提,就能造成無限循環,舉例如下: http://i.imgur.com/eLMaCMx.jpg
有劫ABC三個,黑提A劫,白提B劫,黑提C劫,白提A劫,黑提B劫,白提C劫, 然後黑提A劫循環。 電腦會考慮所有的可能情況,所以必然會考慮到循環盤面的發生, 如果電腦在贏定的情況下,想要簡化盤面最好的辦法就是一個劫都不要製造, 萬一不幸出現打劫,也不會回提,這樣就能完美迴避循環盤面的發生。 所以不管是李世石還是誰,想打劫沒那麼容易, 除非AlphaGo局勢差到不打劫不會贏,否則想讓AlphaGo打劫是不可能的。 換言之,如果AlphaGo開始打劫,我覺得人類就可以歡呼了。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.171.254.47 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457676293.A.BFE.html

03/11 14:06, , 1F
之前對歐洲棋王的時候早就打劫過了不是
03/11 14:06, 1F

03/11 14:06, , 2F
問題是在於說 好 就算阿法狗的確比較不想陷入打劫的情況
03/11 14:06, 2F

03/11 14:07, , 3F
那也不代表當真的進入那個情況時對阿法狗比較不利
03/11 14:07, 3F

03/11 14:07, , 4F
循環盤面下,以阿發狗的精算力不會算不出勝負最高的順序
03/11 14:07, 4F

03/11 14:07, , 5F
打劫不是問題 問題是局勢一路佔優幹嘛打劫
03/11 14:07, 5F

03/11 14:07, , 6F
解,反而對李世石來說比較不利。
03/11 14:07, 6F

03/11 14:07, , 7F
換言之,不論在任何情況下,雙方都不出現打劫的局面,對
03/11 14:07, 7F

03/11 14:08, , 8F
李世石來說反而才是最佳的。
03/11 14:08, 8F

03/11 14:08, , 9F
其實是沒有理由要打結 當然就看不到打劫下法
03/11 14:08, 9F

03/11 14:08, , 10F
Alphago"不會"考慮所有的可能情況
03/11 14:08, 10F

03/11 14:09, , 11F
所以上一篇李喆那個抓到重點了, 刻意製造打劫不會有效
03/11 14:09, 11F

03/11 14:11, , 12F
就算是分散式,運算力也不夠考慮所有的情況吧
03/11 14:11, 12F

03/11 14:13, , 13F
整個職棋界只有李喆抓到重點,這還蠻悲劇的…
03/11 14:13, 13F

03/11 14:23, , 14F
三劫哪那麼容易出現...普通的劫並不是循環局面
03/11 14:23, 14F

03/11 14:25, , 15F
有利的局面演算法會靠近它, 不利的會避免它
03/11 14:25, 15F

03/11 14:26, , 16F
AG一直躲避打劫是寫進它的演算法靈魂的.
03/11 14:26, 16F

03/11 14:27, , 17F
棋是兩方在下的,想刻意造劫也沒那麼容易
03/11 14:27, 17F

03/11 14:30, , 18F
假如AG打劫很強那它的靈魂會告訴它狂打劫,局面複雜化.
03/11 14:30, 18F

03/11 14:39, , 19F
推推
03/11 14:39, 19F

03/11 14:40, , 20F
打劫對AI計算複雜度絕對是提高的 但我覺得AlphaGo應該也夠強
03/11 14:40, 20F

03/11 14:48, , 21F
To shyangs: 但是它可能會避免『不特別有利的打劫』,
03/11 14:48, 21F

03/11 14:49, , 22F
不是因為會不利,而純粹是因為搜尋樹太長的時候比較模糊
03/11 14:49, 22F

03/11 14:49, , 23F
對樊麾的第五盤就打過劫了 之前七盤沒打劫是哪來的謠言
03/11 14:49, 23F

03/11 14:49, , 24F
,感覺比較難贏
03/11 14:49, 24F

03/11 14:50, , 25F
而且AG應該不能理解『打劫是我的強項對手的弱項』。
03/11 14:50, 25F

03/11 14:52, , 26F
李九段的棋譜相對於它自己跟自己下的幾千萬盤太少了,
03/11 14:52, 26F

03/11 14:52, , 27F
我想它唯一可以說是『理解』的棋士只有它自己 :p
03/11 14:52, 27F

03/11 14:53, , 28F
而且他會把對面的棋士當"自己"來算
03/11 14:53, 28F

03/11 14:56, , 29F
感覺比較難贏,這表示它有感情和執念
03/11 14:56, 29F

03/11 14:56, , 30F
AG寧願虧損也不打劫,利用這個執念,每次占它個幾目便宜
03/11 14:56, 30F

03/11 14:59, , 31F
等Google願意放AG出來跟一般人下就知道結果了
03/11 14:59, 31F

03/11 15:05, , 32F
不是啦,『感覺』是我的擬人化用語,抱歉...
03/11 15:05, 32F

03/11 15:07, , 33F
我的『感覺』意思是『它自己認為誤差大概不小的計算』XD
03/11 15:07, 33F

03/11 15:08, , 34F
(這也只是我自己的猜測,論文沒有說)
03/11 15:08, 34F

03/11 15:12, , 35F
展現偏好,不管自己的強弱項,已經是擁有感情的特徵
03/11 15:12, 35F

03/11 15:22, , 36F
也推一下fasttrack XD,一語中的
03/11 15:22, 36F

03/11 15:28, , 37F
你又知道他算得出了 XD
03/11 15:28, 37F

03/11 15:31, , 38F
因為AG有自我對戰學習的資料,演算法也會算落子後幾步的
03/11 15:31, 38F

03/11 15:32, , 39F
發展給分回頭再給勝率評價,所以的確是會推測對手的下法
03/11 15:32, 39F

03/11 15:32, , 40F
,這是沒錯的。
03/11 15:32, 40F

03/11 16:28, , 41F
最好是ai自己跟自己下不會打劫過 規則都定給好了
03/11 16:28, 41F
文章代碼(AID): #1Muc05l- (GO)
文章代碼(AID): #1Muc05l- (GO)