[閒聊] 科技進展對於圍棋的影響 (圍棋軟體歷史 & 突破的AlphaGo)

看板GO作者 (wukevinboy)時間8年前 (2016/03/11 20:12), 8年前編輯推噓20(21156)
留言78則, 19人參與, 5年前最新討論串1/1
一樣,開頭先註明我是台灣業餘六段中間水平。 現在想要註明棋力的原因是因為自己本身是業餘棋手,加上版上小亂。 業餘評論總有相對於職業棋手不足的地方,所以分析上如果出了問題請多包涵。 這次的事情我僅僅想聊聊圍棋的部分,畢竟電腦這塊演算法等等的技術,對於一 個非資工相關科系的來說,要來解析已經是過於的專業了,希望大家互相尊重專 業。如今看到許多人是 圍棋人 評論 這程式、演算法該怎樣設計的鍵盤工程師, 但也有許多工程師對於圍棋並不熟悉,也在評論圍棋已經被電腦擊垮,但圍棋並 不是結果論導向的棋類,甚至有圍棋、演算法都不懂的人也來"參一咖"。但是我 今天還是看到幾位朋友也是努力的做好功課再來發問,而且態度誠懇。這種發問 只要我能力所及,我也很願意回復"圍棋"相關領域的問題。 根據以上,少數人僅僅以李世石被 AlphaGo 擊倒就說電腦圍棋已經征服棋界,是否 過於盲目?不只是圍棋,我相信許多棋類遊戲都並不是結果論的棋類,或許這部分 有些人不能認同我的觀點,包刮我的棋友也有些認為"輸就是輸了",但我最看重的不 是結果,而是那棋的過程、內容以及其趣味性。 今天對於李世石來說,是難得能稍作緩衝的一天... 對於我這小李腦粉,也是難得能來相較輕鬆聊一下我對 AlphaGo 的看法。 首先,看過我之前對 AlphaGo 的評價,想必大家已經知道 AlphaGo 第一次釋出的 樊麾版,與和李世石對弈的版本存在著極大的差異,但樊麾版的 AlphaGo 已經是 夠驚人了,更不用說和李世石對弈的 AlphaGo,那真是沒辦法想像。 還記得小時候我第一次接觸到的電腦軟體應該是西遊記,是民國 90 年左右的事情了, 那時候我剛學圍棋,大班~小一的年紀,我開始與一些電腦圍棋軟體對弈。 西遊記是一個以給小孩玩樂導向的棋類軟體,他的水平相對來說非常的差,所以也是 很適合給小孩來下,因為太難,小孩反而玩的興致缺缺。 以下請象棋人大概看看,如果不是象棋人可考慮忽略。 ------------------------------------------------------------------------- 如果不能理解,請大家想想象棋軟體,其他棋藝軟體,在手機上都可以到達一定的水 平了,但是玩起來卻特別困難,原因是因為玩沒兩下就輸了,象棋軟體我舉例電腦版 的象棋巫師,水平大概已經有象棋的四、五段,對於我這個高中去玩個棋藝類社團, 一個月聽幾次社課就上段沒受過正規訓練的象棋初段玩家,象棋軟體已經是非常困難了。 ------------------------------------------------------------------------- 而在學棋過程中,陸續出現了"烏鷺"、"CrazyStone"、"Zen"等各種版本,這也說明了 科技不斷的進步,我們甚至可以開始依賴電腦來學習一些比較有技術性質的技能,然而 當我們下到一定的程度,我們會開始降低和電腦圍棋對弈的次數,因為在那時候,電腦 圍棋往往有一些怪模怪樣的走法,不宜拿來分析、理解,所以我們開始改成使用"網路" 來練習棋藝,舉個大家通常都知道的例子:棋靈王的進藤光、佐為。 然而 AlphaGo 卻不同於以往的棋藝類軟體,他的怪招,不合理、不合邏輯的招數相對 較少,但你會說 AlphaGo 完全沒有不合理的棋步嗎? 當然不是,他還是有一些不合理的棋步,只是相對於以前市面上流通的圍棋軟體版本, 他的不合理棋步,相對的較少,而且它甚至開始顛覆一些我們對於棋類的理解。 黑嘉嘉說她對於 AlphaGo 贏了李世石很驚訝,但是更讓她驚訝的是,AlphaGo 居然是以 這樣的走法贏了李世石,或許 AlphaGo 會顛覆一些我們以前的認知也說不定。 小時候我印象我還是用撥接,還是 Windows 95系統,但是過一陣子出現了 XP,我開始 用線上棋藝軟體與大家對弈,記得第一次碰到的是 LGS ,甚至有些人碰到更早的軟體, 而國中幾乎沒下棋,後續高中我又開始用了棋城圍棋來上網與人對弈,就這樣從五段自 學升上了六段,這些都是科技發展對圍棋帶來的影響。從原本的來往棋社,變成了網路 上找老師、找對弈對手、陪練等等的。 接下來進入最近非常夯的 AlphaGo 正題 這次 AlphaGo 之所以讓人感到驚訝,甚至說害怕,其主要原因並不是它在棋類的感覺 已經超越了一流棋手,而是它吸收了許多一流棋手的棋譜,對於每位一流棋手的棋路都 有它一定的想法在,然而有些人說 AlphaGo 有了李世石那麼多的棋譜,而李世石僅僅有 AlphaGo 5盤與樊麾對弈的樣本,對於李世石來說這是非常不公平的。 一開始我也是這樣認為,但後來想想不太對...李世石這兩盤不僅沒什麼發揮,而且他下 的棋也與以往的他有了極大的不同之處,下棋的人通常稱之為:棋風。李世石大家常常 稱呼他是棋盤上的勝負師,原因是因為他對於勝負棋形的敏銳度更加高明。 但 AlphaGo 就算是有李世石的對弈樣本,面對上這次李世石的發揮,其實 AlphaGo 裡 面有李世石的對弈棋譜,應該也沒差才對。畢竟這兩次的發揮真的已經不是李世石的棋 風,如果真要說雙方有什麼不公平之處,就是李世石擁有 AlphaGo 棋譜的量實在太少, 所以這次並非 AlphaGo 熟知李世石行棋步調,而是李世石對 AlphaGo 了解太少。 這次李世石的行棋棋風,我個人是認為失去了勝負師的氣勢。 而這次 AlphaGo 真正贏棋的主因,還是因為李世石面對上了一個完全沒有情緒的機器。 而昨天,我與我高中象棋棋友聊到這次 AlphaGo ,那位象棋棋友啟發了我一個靈感,其 實 AlphaGo 的棋很保守,非常的龜。有點像是象棋的守陣,但它在保守之餘也不忘記對 對方"弱點"進行一定程度上的打擊,我認為這是這幾盤 AlphaGo 行棋上比較可怕的地方 ,而 AlphaGo 如果真要談論它的棋風,它較為偏好實地。 我每次寫我觀戰 AlphaGo 棋譜的心得,基本上是不看職業棋士解說,而是以一個業餘身 分棋手來評論 AlphaGo 的棋,而寫完後我有時間可能會去看看職業棋士的解說,與我的 解譜有什麼出入在?我哪裡理解的還不夠好?而這次很訝異的是,我和某些職業棋手對於 這幾盤李世石的走法,都存在類似的疑問。如果對於這些判斷沒有錯誤的話,那可以說 李世石的棋已經犯下了不少"業餘棋手"都看得出來的失誤。 我以前打譜通常只打李世石、古力的棋譜,而李昌鎬和吳清源的或許也有打過,但不是那 麼認真的在打他們的譜,在打李世石的棋譜時,當他走出問題手,我也不太容易看出,往 往都要看解說棋譜仔細思考後,才能明白為什麼解說會說李世石的這手有疑問。 在今天中午吃午餐時,我把孟泰齡(泰哥)的講解看完,理解了一遍,然而我比較驚訝的是 泰哥的形式判斷,和我的判斷居然是差這麼的多。 http://i.imgur.com/QcljpmT.png
到這裡我已經覺得電腦至少小勝了,而泰哥卻說很不明朗,當時我不太明白難道我的判斷 有問題嗎?但後面泰哥的話讓我反覆的思考了一下。 http://i.imgur.com/LqmBwTf.png
泰哥到這裡說了,這裡 AlphaGo 淡定的虎了一手,他才發現原來 AlphaGo 領先了這麼多 那前面 AlphaGo 的行棋厚時都可以理解了。 而前面,我覺得 AlphaGo 已經至少有小優勢存在了,那為什麼泰哥職業棋手的判斷,會 判斷的差這麼多呢?仔細想了一下,想到我平常都在網路上下棋,沒事就會去按"形式判 斷",所以我認為自己的形勢判斷更較偏向電腦(會多算些虛空),不是人腦的形勢判斷, 通常人腦的形勢判斷,會稍微低估一些虛空。 這件事情讓我懷疑 AlphaGo 的形勢判斷是不是會有點類似市面上的圍棋軟體,所以導致 它一直是認為自己佔據優勢、主動的一方,其實可以看一下一些圍棋軟體的形勢判斷, 可以發現 AlphaGo 幾乎都是目數一直領先到底,而且被估算的空多。 最後,對於大家說的李世石是否有簽秘密條款,我不管怎樣都不會相信的,而會提出這些 想法的通常都是有一定棋齡的棋手,這些說法對於李世石也是一種不尊重。希望大家不要 再有這些對於目前無意義的猜測,等到總比數出來,再來聽聽看他們怎麼說吧。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 124.218.70.54 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457698358.A.44E.html

03/11 20:16, , 1F
西遊記 是說圍棋習遊記嗎XD
03/11 20:16, 1F
應該就是西遊記...裡面有五個人物 豬八戒、沙悟淨、孫悟空、唐三藏、觀世音

03/11 20:26, , 2F
恩...我想AlphGo並不會最形勢判斷這種事情 他不是由形勢
03/11 20:26, 2F

03/11 20:27, , 3F
判斷來決定下在虎那一手的 而是他覺得下在那邊勝率最高
03/11 20:27, 3F

03/11 20:28, , 4F
另外我很同意你說的 這場李世石沒有下出他的棋風 但是現
03/11 20:28, 4F

03/11 20:28, , 5F
在很多人都在說因為阿發夠太強導致李無法發揮他應有實力
03/11 20:28, 5F

03/11 20:29, , 6F
對於這種想法我也只能表示無奈 好像阿發夠有超能力可以
03/11 20:29, 6F

03/11 20:29, , 7F
催眠李一樣...
03/11 20:29, 7F
看過相關的文章,確實都說它只挑勝率高的走,但挑勝率高的走沒有形判真的蠻奇葩的。

03/11 20:34, , 8F
所以說就是跟我們人類的邏輯不一樣嘛~
03/11 20:34, 8F

03/11 20:35, , 9F
有形式判斷
03/11 20:35, 9F

03/11 20:36, , 10F
我自己猜測是一定有個類似判斷的標準在 但是不是我們所謂的"形式判斷"就不清楚了

03/11 20:41, , 11F
很佩服你總是勇於發表自己的看法
03/11 20:41, 11F
謝謝,對於圍棋領域我想部分的棋 我還是有一定的自信講得可以 但是我今天看了泰哥的分析 真心覺得職業真的就是看得比業餘還要多很多...

03/11 20:41, , 12F
所以你要怎麼解釋第二盤已經到了大官階段落後10+目,卻連
03/11 20:41, 12F

03/11 20:41, , 13F
右上的劫都不開?
03/11 20:41, 13F

03/11 20:42, , 14F
懷疑協定不是不尊重,可能恰恰是因為太清楚李的實力才會這
03/11 20:42, 14F

03/11 20:42, , 15F
樣想
03/11 20:42, 15F
如果是李世石,不可能接了需要簽這種協議的戰帖,當然這是我自己的看法。 對於右上的劫爭不開劫,我覺得是李世石最終的短路,而不是簽了什麼條款、協議。 常常關注李世石近期比賽的,應該都知道他和柯潔最後逆轉半目勝,剩下一兩目小官, 都打了勺...導致最後失去了冠軍。

03/11 20:42, , 16F
論文裡沒有詳細說明局部評分使用的特徵
03/11 20:42, 16F

03/11 20:43, , 17F
所以和人類形式判斷相似度不知
03/11 20:43, 17F
讀相關論文,還有相關的電腦層面知識對目前的我來說實在有太大的難度... 今天也有問老師相關於,蒙地卡羅樹到底是什麼?老師大概解釋了大概方向。 但是這方面真的太專業了,我無法插上話。

03/11 20:44, , 18F
我的意思是白172改走173位
03/11 20:44, 18F
知道你的意思,我也很疑惑,但李世石比賽屢次錯失良機,是最近經常發生的事情 所以我相信是他的失誤,而不是他簽了條款。

03/11 20:48, , 19F
一直不開劫真的是很費解 現在既然Aja出來闢謠了的話我是
03/11 20:48, 19F

03/11 20:48, , 20F
比較傾向覺得李這盤有點太戰戰兢兢了 不敢放手一搏
03/11 20:48, 20F
這也是我失望的部分。

03/11 20:51, , 21F
我覺得跟人對弈當然不會,可是和電腦AI則是一種嘗試
03/11 20:51, 21F

03/11 20:53, , 22F
已經進入讀秒
03/11 20:53, 22F
其實我印象李世石的讀秒功力,也是很深厚。

03/11 20:56, , 23F
飛刀也是鈍了QQ
03/11 20:56, 23F
說真的柯潔被電腦完封,和小李輸一場,小李輸一場對我來說比較痛...

03/11 21:11, , 24F
@TS13:論文有寫特徵啊,http://tinyurl.com/jyvk2y3
03/11 21:11, 24F

03/11 21:12, , 25F
48個channel
03/11 21:12, 25F

03/11 21:29, , 26F
就說是圍棋的工業革命啦
03/11 21:29, 26F

03/11 21:36, , 27F
那個是否算SL描述"整個"盤面的特徵,以決定下一手
03/11 21:36, 27F

03/11 21:38, , 28F
局部RL的部分Table 4就比較不詳細 (有錯請指證
03/11 21:38, 28F

03/11 21:40, , 29F
忘記小時候軟體名 當時讓電腦9子還是樂勝 比跟人下還無趣
03/11 21:40, 29F
這種軟體以前超多 後來都消失了吧 西遊記我聽說棋院還有在賣

03/11 22:14, , 30F
紅明顯 沒有所謂協議 alphaGo首席研發者之一出來澄清過了
03/11 22:14, 30F

03/11 22:15, , 31F
對goole來說 這種協議也沒意義 因為他們也想看電腦的判斷
03/11 22:15, 31F
我是基本相信李世石,而且 google 沒必要做這種事情搞臭自己

03/11 22:23, , 32F
很好奇是否有可能人類過去的經驗導致低估了中央虛空的
03/11 22:23, 32F

03/11 22:24, , 33F
潛力,像第二盤黑37看似無太大用處,結果隨著戰局到最
03/11 22:24, 33F

03/11 22:25, , 34F
後不但幫助了左下兩子逃出也在右下中空區圍了不少地
03/11 22:25, 34F

03/11 22:26, , 35F
因為中央的討論太複雜了也沒有較有準則的指標,所以人
03/11 22:26, 35F

03/11 22:27, , 36F
們也較少的研究,也因為較少的研究就更不會去下他
03/11 22:27, 36F

03/11 22:28, , 37F
以這次人工智慧的程式演算法他不管邊角中央他都會去嘗
03/11 22:28, 37F

03/11 22:29, , 38F
試自我對奕時下下看,而經由大量對奕累積的數據對於在
03/11 22:29, 38F

03/11 22:30, , 39F
中央落子的效益可能會做得比較好
03/11 22:30, 39F
這個倒是不太可能,因為這個在棋理上,有蠻明顯的根據,倒是電腦的思路可以好好推敲一下。

03/11 22:38, , 40F
中央的妙手 以前幾乎都是人類天才棋手的專利
03/11 22:38, 40F

03/11 22:39, , 41F
但是AG 的大量自我練習 可能讓他那邊變得很強
03/11 22:39, 41F

03/11 23:56, , 42F
我對圍棋西遊記有印象,小時候玩過XD
03/11 23:56, 42F
當時一直打觀世音 XDD

03/12 00:09, , 43F
在棋局某點開始重復對局N遍,一步有n1種可能,二步有n2可
03/12 00:09, 43F

03/12 00:09, , 44F
能,...,直到棋盤結束,可能發展長得像樹,蒙地卡羅是隨機
03/12 00:09, 44F

03/12 00:10, , 45F
的意思,電腦不是強在分析,而是強在下個N(>10000)遍,找出
03/12 00:10, 45F

03/12 00:11, , 46F
某個落子是否勝算高,類神經網路可以幫助記憶這些結果
03/12 00:11, 46F

03/12 00:27, , 47F
啊... indium111 有寫了, 抱歉佔版面
03/12 00:27, 47F
很感謝各位的指點,這部分今天有特別問學校老師,但是老師跟我的比喻,我還是想不通 一些判斷機制,怎麼去"算"這些樹。 ※ 編輯: wukevinboy (124.218.70.54), 03/12/2016 01:15:30

03/12 05:00, , 48F
假如之後三場阿法狗還有臭棋的話可能真的要思考一下
03/12 05:00, 48F

03/12 05:22, , 49F
容許我再班門弄斧一下XD,想幫indium111從不同方向補充
03/12 05:22, 49F

03/12 05:22, , 50F
首先,資工人的樹是頭下腳上的,根在上面,葉子在下面。
03/12 05:22, 50F

03/12 05:23, , 51F
讓我們簡化情況,假設有一個恰好30子之後會結束的棋盤,
03/12 05:23, 51F

03/12 05:23, , 52F
輪到你而你執黑,對手執白。雖然有很多位置可以落子,但
03/12 05:23, 52F

03/12 05:24, , 53F
是你根據經驗判斷認為除了某兩子之外都是壞手不值得考慮
03/12 05:24, 53F

03/12 05:24, , 54F
那麼『根』就是初始盤面,這個根有兩個『小孩』就是你下
03/12 05:24, 54F

03/12 05:25, , 55F
了那兩手以後分別得到的盤面。
03/12 05:25, 55F

03/12 05:26, , 56F
你下了一手之後換白子,假設你根據經驗仍然判斷白子只有
03/12 05:26, 56F

03/12 05:26, , 57F
兩手不是壞手,那麼這兩個小孩就各自又有兩個小孩。表示
03/12 05:26, 57F

03/12 05:27, , 58F
你下了之後白子也應了一手的盤面。
03/12 05:27, 58F

03/12 05:27, , 59F
所以第一層(根)有一個,第二層分叉2個,第三層分叉4個..
03/12 05:27, 59F

03/12 05:28, , 60F
到第30層就有2^29=約十億個,假設電腦能算的來。
03/12 05:28, 60F

03/12 05:29, , 61F
這時候這十億個就是『葉子』棋局到此結束(根據我的假設)
03/12 05:29, 61F

03/12 05:30, , 62F
現在怎麼"算"這些樹呢? 每個葉子要不是黑贏要不是白贏,
03/12 05:30, 62F

03/12 05:31, , 63F
所以每個葉子要跟他在第29層的父親說是誰贏了,由於第29
03/12 05:31, 63F

03/12 05:31, , 64F
層是輪到黑子下,所以如果29層的盤面的兩個『小孩』有
03/12 05:31, 64F

03/12 05:32, , 65F
任何一個是黑子贏,那這個盤面就標記為黑子贏。反之如果
03/12 05:32, 65F

03/12 05:32, , 66F
兩個小孩都說白子贏,那就標記白子贏。
03/12 05:32, 66F

03/12 05:34, , 67F
現在回到第28層,第28層是輪到白子下,所以判斷方式相反
03/12 05:34, 67F

03/12 05:35, , 68F
如果兩個小孩至少一個說白子贏就白子贏,否則才黑子贏。
03/12 05:35, 68F

03/12 05:36, , 69F
於是這樣子從根出發,一路層層往下問(所謂遞迴),最後得
03/12 05:36, 69F

03/12 05:36, , 70F
第2層的兩個盤面是黑子贏還是白子贏,然後你就選黑子贏
03/12 05:36, 70F

03/12 05:37, , 71F
的那個下啦XD,如果有的話。
03/12 05:37, 71F

03/12 05:37, , 72F
實際上有好多困難: (1)不只三十步要算 (2)也不會知道只
03/12 05:37, 72F

03/12 05:38, , 73F
有兩個好手要考慮 (3)好壞手是程度問題,不能一刀切
03/12 05:38, 73F

03/12 05:40, , 74F
於是AlphaGo一方面要有強力的估計好壞手的能力,另一方
03/12 05:40, 74F

03/12 05:40, , 75F
面不管估計能力多強都不可能做到上面那樣,所以要逼近,
03/12 05:40, 75F

03/12 05:41, , 76F
蒙特卡羅樹可以想成對上面的理想狀態樹的一種逼近。
03/12 05:41, 76F
感謝補充啊!去趨勢科技和學校老師講解 大概聽過 AlphaGo 只是詳細的判斷就不清楚了

03/12 10:07, , 77F
看AlphaGo的棋譜應該沒什麼用 他沒有習性 變動的速度太快
03/12 10:07, 77F
※ 編輯: wukevinboy (124.218.70.54), 03/13/2016 23:24:05

04/03 00:32, 5年前 , 78F
04/03 00:32, 78F
文章代碼(AID): #1MuhOsHE (GO)