[閒聊] 科技進展對於圍棋的影響 (圍棋軟體歷史 & 突破的AlphaGo)
一樣,開頭先註明我是台灣業餘六段中間水平。
現在想要註明棋力的原因是因為自己本身是業餘棋手,加上版上小亂。
業餘評論總有相對於職業棋手不足的地方,所以分析上如果出了問題請多包涵。
這次的事情我僅僅想聊聊圍棋的部分,畢竟電腦這塊演算法等等的技術,對於一
個非資工相關科系的來說,要來解析已經是過於的專業了,希望大家互相尊重專
業。如今看到許多人是 圍棋人 評論 這程式、演算法該怎樣設計的鍵盤工程師,
但也有許多工程師對於圍棋並不熟悉,也在評論圍棋已經被電腦擊垮,但圍棋並
不是結果論導向的棋類,甚至有圍棋、演算法都不懂的人也來"參一咖"。但是我
今天還是看到幾位朋友也是努力的做好功課再來發問,而且態度誠懇。這種發問
只要我能力所及,我也很願意回復"圍棋"相關領域的問題。
根據以上,少數人僅僅以李世石被 AlphaGo 擊倒就說電腦圍棋已經征服棋界,是否
過於盲目?不只是圍棋,我相信許多棋類遊戲都並不是結果論的棋類,或許這部分
有些人不能認同我的觀點,包刮我的棋友也有些認為"輸就是輸了",但我最看重的不
是結果,而是那棋的過程、內容以及其趣味性。
今天對於李世石來說,是難得能稍作緩衝的一天...
對於我這小李腦粉,也是難得能來相較輕鬆聊一下我對 AlphaGo 的看法。
首先,看過我之前對 AlphaGo 的評價,想必大家已經知道 AlphaGo 第一次釋出的
樊麾版,與和李世石對弈的版本存在著極大的差異,但樊麾版的 AlphaGo 已經是
夠驚人了,更不用說和李世石對弈的 AlphaGo,那真是沒辦法想像。
還記得小時候我第一次接觸到的電腦軟體應該是西遊記,是民國 90 年左右的事情了,
那時候我剛學圍棋,大班~小一的年紀,我開始與一些電腦圍棋軟體對弈。
西遊記是一個以給小孩玩樂導向的棋類軟體,他的水平相對來說非常的差,所以也是
很適合給小孩來下,因為太難,小孩反而玩的興致缺缺。
以下請象棋人大概看看,如果不是象棋人可考慮忽略。
-------------------------------------------------------------------------
如果不能理解,請大家想想象棋軟體,其他棋藝軟體,在手機上都可以到達一定的水
平了,但是玩起來卻特別困難,原因是因為玩沒兩下就輸了,象棋軟體我舉例電腦版
的象棋巫師,水平大概已經有象棋的四、五段,對於我這個高中去玩個棋藝類社團,
一個月聽幾次社課就上段沒受過正規訓練的象棋初段玩家,象棋軟體已經是非常困難了。
-------------------------------------------------------------------------
而在學棋過程中,陸續出現了"烏鷺"、"CrazyStone"、"Zen"等各種版本,這也說明了
科技不斷的進步,我們甚至可以開始依賴電腦來學習一些比較有技術性質的技能,然而
當我們下到一定的程度,我們會開始降低和電腦圍棋對弈的次數,因為在那時候,電腦
圍棋往往有一些怪模怪樣的走法,不宜拿來分析、理解,所以我們開始改成使用"網路"
來練習棋藝,舉個大家通常都知道的例子:棋靈王的進藤光、佐為。
然而 AlphaGo 卻不同於以往的棋藝類軟體,他的怪招,不合理、不合邏輯的招數相對
較少,但你會說 AlphaGo 完全沒有不合理的棋步嗎?
當然不是,他還是有一些不合理的棋步,只是相對於以前市面上流通的圍棋軟體版本,
他的不合理棋步,相對的較少,而且它甚至開始顛覆一些我們對於棋類的理解。
黑嘉嘉說她對於 AlphaGo 贏了李世石很驚訝,但是更讓她驚訝的是,AlphaGo 居然是以
這樣的走法贏了李世石,或許 AlphaGo 會顛覆一些我們以前的認知也說不定。
小時候我印象我還是用撥接,還是 Windows 95系統,但是過一陣子出現了 XP,我開始
用線上棋藝軟體與大家對弈,記得第一次碰到的是 LGS ,甚至有些人碰到更早的軟體,
而國中幾乎沒下棋,後續高中我又開始用了棋城圍棋來上網與人對弈,就這樣從五段自
學升上了六段,這些都是科技發展對圍棋帶來的影響。從原本的來往棋社,變成了網路
上找老師、找對弈對手、陪練等等的。
接下來進入最近非常夯的 AlphaGo 正題
這次 AlphaGo 之所以讓人感到驚訝,甚至說害怕,其主要原因並不是它在棋類的感覺
已經超越了一流棋手,而是它吸收了許多一流棋手的棋譜,對於每位一流棋手的棋路都
有它一定的想法在,然而有些人說 AlphaGo 有了李世石那麼多的棋譜,而李世石僅僅有
AlphaGo 5盤與樊麾對弈的樣本,對於李世石來說這是非常不公平的。
一開始我也是這樣認為,但後來想想不太對...李世石這兩盤不僅沒什麼發揮,而且他下
的棋也與以往的他有了極大的不同之處,下棋的人通常稱之為:棋風。李世石大家常常
稱呼他是棋盤上的勝負師,原因是因為他對於勝負棋形的敏銳度更加高明。
但 AlphaGo 就算是有李世石的對弈樣本,面對上這次李世石的發揮,其實 AlphaGo 裡
面有李世石的對弈棋譜,應該也沒差才對。畢竟這兩次的發揮真的已經不是李世石的棋
風,如果真要說雙方有什麼不公平之處,就是李世石擁有 AlphaGo 棋譜的量實在太少,
所以這次並非 AlphaGo 熟知李世石行棋步調,而是李世石對 AlphaGo 了解太少。
這次李世石的行棋棋風,我個人是認為失去了勝負師的氣勢。
而這次 AlphaGo 真正贏棋的主因,還是因為李世石面對上了一個完全沒有情緒的機器。
而昨天,我與我高中象棋棋友聊到這次 AlphaGo ,那位象棋棋友啟發了我一個靈感,其
實 AlphaGo 的棋很保守,非常的龜。有點像是象棋的守陣,但它在保守之餘也不忘記對
對方"弱點"進行一定程度上的打擊,我認為這是這幾盤 AlphaGo 行棋上比較可怕的地方
,而 AlphaGo 如果真要談論它的棋風,它較為偏好實地。
我每次寫我觀戰 AlphaGo 棋譜的心得,基本上是不看職業棋士解說,而是以一個業餘身
分棋手來評論 AlphaGo 的棋,而寫完後我有時間可能會去看看職業棋士的解說,與我的
解譜有什麼出入在?我哪裡理解的還不夠好?而這次很訝異的是,我和某些職業棋手對於
這幾盤李世石的走法,都存在類似的疑問。如果對於這些判斷沒有錯誤的話,那可以說
李世石的棋已經犯下了不少"業餘棋手"都看得出來的失誤。
我以前打譜通常只打李世石、古力的棋譜,而李昌鎬和吳清源的或許也有打過,但不是那
麼認真的在打他們的譜,在打李世石的棋譜時,當他走出問題手,我也不太容易看出,往
往都要看解說棋譜仔細思考後,才能明白為什麼解說會說李世石的這手有疑問。
在今天中午吃午餐時,我把孟泰齡(泰哥)的講解看完,理解了一遍,然而我比較驚訝的是
泰哥的形式判斷,和我的判斷居然是差這麼的多。
http://i.imgur.com/QcljpmT.png
到這裡我已經覺得電腦至少小勝了,而泰哥卻說很不明朗,當時我不太明白難道我的判斷
有問題嗎?但後面泰哥的話讓我反覆的思考了一下。
http://i.imgur.com/LqmBwTf.png
泰哥到這裡說了,這裡 AlphaGo 淡定的虎了一手,他才發現原來 AlphaGo 領先了這麼多
那前面 AlphaGo 的行棋厚時都可以理解了。
而前面,我覺得 AlphaGo 已經至少有小優勢存在了,那為什麼泰哥職業棋手的判斷,會
判斷的差這麼多呢?仔細想了一下,想到我平常都在網路上下棋,沒事就會去按"形式判
斷",所以我認為自己的形勢判斷更較偏向電腦(會多算些虛空),不是人腦的形勢判斷,
通常人腦的形勢判斷,會稍微低估一些虛空。
這件事情讓我懷疑 AlphaGo 的形勢判斷是不是會有點類似市面上的圍棋軟體,所以導致
它一直是認為自己佔據優勢、主動的一方,其實可以看一下一些圍棋軟體的形勢判斷,
可以發現 AlphaGo 幾乎都是目數一直領先到底,而且被估算的空多。
最後,對於大家說的李世石是否有簽秘密條款,我不管怎樣都不會相信的,而會提出這些
想法的通常都是有一定棋齡的棋手,這些說法對於李世石也是一種不尊重。希望大家不要
再有這些對於目前無意義的猜測,等到總比數出來,再來聽聽看他們怎麼說吧。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 124.218.70.54
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457698358.A.44E.html
推
03/11 20:16, , 1F
03/11 20:16, 1F
應該就是西遊記...裡面有五個人物 豬八戒、沙悟淨、孫悟空、唐三藏、觀世音
推
03/11 20:26, , 2F
03/11 20:26, 2F
→
03/11 20:27, , 3F
03/11 20:27, 3F
→
03/11 20:28, , 4F
03/11 20:28, 4F
→
03/11 20:28, , 5F
03/11 20:28, 5F
→
03/11 20:29, , 6F
03/11 20:29, 6F
→
03/11 20:29, , 7F
03/11 20:29, 7F
看過相關的文章,確實都說它只挑勝率高的走,但挑勝率高的走沒有形判真的蠻奇葩的。
推
03/11 20:34, , 8F
03/11 20:34, 8F
→
03/11 20:35, , 9F
03/11 20:35, 9F
→
03/11 20:36, , 10F
03/11 20:36, 10F
我自己猜測是一定有個類似判斷的標準在 但是不是我們所謂的"形式判斷"就不清楚了
推
03/11 20:41, , 11F
03/11 20:41, 11F
謝謝,對於圍棋領域我想部分的棋 我還是有一定的自信講得可以
但是我今天看了泰哥的分析 真心覺得職業真的就是看得比業餘還要多很多...
→
03/11 20:41, , 12F
03/11 20:41, 12F
→
03/11 20:41, , 13F
03/11 20:41, 13F
→
03/11 20:42, , 14F
03/11 20:42, 14F
→
03/11 20:42, , 15F
03/11 20:42, 15F
如果是李世石,不可能接了需要簽這種協議的戰帖,當然這是我自己的看法。
對於右上的劫爭不開劫,我覺得是李世石最終的短路,而不是簽了什麼條款、協議。
常常關注李世石近期比賽的,應該都知道他和柯潔最後逆轉半目勝,剩下一兩目小官,
都打了勺...導致最後失去了冠軍。
→
03/11 20:42, , 16F
03/11 20:42, 16F
→
03/11 20:43, , 17F
03/11 20:43, 17F
讀相關論文,還有相關的電腦層面知識對目前的我來說實在有太大的難度...
今天也有問老師相關於,蒙地卡羅樹到底是什麼?老師大概解釋了大概方向。
但是這方面真的太專業了,我無法插上話。
推
03/11 20:44, , 18F
03/11 20:44, 18F
知道你的意思,我也很疑惑,但李世石比賽屢次錯失良機,是最近經常發生的事情
所以我相信是他的失誤,而不是他簽了條款。
推
03/11 20:48, , 19F
03/11 20:48, 19F
→
03/11 20:48, , 20F
03/11 20:48, 20F
這也是我失望的部分。
推
03/11 20:51, , 21F
03/11 20:51, 21F
推
03/11 20:53, , 22F
03/11 20:53, 22F
其實我印象李世石的讀秒功力,也是很深厚。
推
03/11 20:56, , 23F
03/11 20:56, 23F
說真的柯潔被電腦完封,和小李輸一場,小李輸一場對我來說比較痛...
推
03/11 21:11, , 24F
03/11 21:11, 24F
→
03/11 21:12, , 25F
03/11 21:12, 25F
→
03/11 21:29, , 26F
03/11 21:29, 26F
推
03/11 21:36, , 27F
03/11 21:36, 27F
推
03/11 21:38, , 28F
03/11 21:38, 28F
推
03/11 21:40, , 29F
03/11 21:40, 29F
這種軟體以前超多 後來都消失了吧 西遊記我聽說棋院還有在賣
噓
03/11 22:14, , 30F
03/11 22:14, 30F
→
03/11 22:15, , 31F
03/11 22:15, 31F
我是基本相信李世石,而且 google 沒必要做這種事情搞臭自己
推
03/11 22:23, , 32F
03/11 22:23, 32F
→
03/11 22:24, , 33F
03/11 22:24, 33F
→
03/11 22:25, , 34F
03/11 22:25, 34F
→
03/11 22:26, , 35F
03/11 22:26, 35F
→
03/11 22:27, , 36F
03/11 22:27, 36F
→
03/11 22:28, , 37F
03/11 22:28, 37F
→
03/11 22:29, , 38F
03/11 22:29, 38F
→
03/11 22:30, , 39F
03/11 22:30, 39F
這個倒是不太可能,因為這個在棋理上,有蠻明顯的根據,倒是電腦的思路可以好好推敲一下。
推
03/11 22:38, , 40F
03/11 22:38, 40F
→
03/11 22:39, , 41F
03/11 22:39, 41F
推
03/11 23:56, , 42F
03/11 23:56, 42F
當時一直打觀世音 XDD
推
03/12 00:09, , 43F
03/12 00:09, 43F
→
03/12 00:09, , 44F
03/12 00:09, 44F
→
03/12 00:10, , 45F
03/12 00:10, 45F
→
03/12 00:11, , 46F
03/12 00:11, 46F
→
03/12 00:27, , 47F
03/12 00:27, 47F
很感謝各位的指點,這部分今天有特別問學校老師,但是老師跟我的比喻,我還是想不通
一些判斷機制,怎麼去"算"這些樹。
※ 編輯: wukevinboy (124.218.70.54), 03/12/2016 01:15:30
推
03/12 05:00, , 48F
03/12 05:00, 48F
推
03/12 05:22, , 49F
03/12 05:22, 49F
→
03/12 05:22, , 50F
03/12 05:22, 50F
→
03/12 05:23, , 51F
03/12 05:23, 51F
→
03/12 05:23, , 52F
03/12 05:23, 52F
→
03/12 05:24, , 53F
03/12 05:24, 53F
→
03/12 05:24, , 54F
03/12 05:24, 54F
→
03/12 05:25, , 55F
03/12 05:25, 55F
→
03/12 05:26, , 56F
03/12 05:26, 56F
→
03/12 05:26, , 57F
03/12 05:26, 57F
→
03/12 05:27, , 58F
03/12 05:27, 58F
→
03/12 05:27, , 59F
03/12 05:27, 59F
→
03/12 05:28, , 60F
03/12 05:28, 60F
→
03/12 05:29, , 61F
03/12 05:29, 61F
→
03/12 05:30, , 62F
03/12 05:30, 62F
→
03/12 05:31, , 63F
03/12 05:31, 63F
→
03/12 05:31, , 64F
03/12 05:31, 64F
→
03/12 05:32, , 65F
03/12 05:32, 65F
→
03/12 05:32, , 66F
03/12 05:32, 66F
→
03/12 05:34, , 67F
03/12 05:34, 67F
→
03/12 05:35, , 68F
03/12 05:35, 68F
→
03/12 05:36, , 69F
03/12 05:36, 69F
→
03/12 05:36, , 70F
03/12 05:36, 70F
→
03/12 05:37, , 71F
03/12 05:37, 71F
→
03/12 05:37, , 72F
03/12 05:37, 72F
→
03/12 05:38, , 73F
03/12 05:38, 73F
推
03/12 05:40, , 74F
03/12 05:40, 74F
→
03/12 05:40, , 75F
03/12 05:40, 75F
→
03/12 05:41, , 76F
03/12 05:41, 76F
感謝補充啊!去趨勢科技和學校老師講解 大概聽過 AlphaGo 只是詳細的判斷就不清楚了
→
03/12 10:07, , 77F
03/12 10:07, 77F
※ 編輯: wukevinboy (124.218.70.54), 03/13/2016 23:24:05
推
04/03 00:32,
5年前
, 78F
04/03 00:32, 78F