[新聞] 人類如何反轉?人工智慧專家給李世石出招
人類如何反轉?人工智慧專家給李世石出點招
作者:戴文淵
如果說1997年IBM深藍戰勝國際象棋世界冠軍卡斯帕羅夫是機器突破了人類的第一道
防線話,2016年AlphaGo是不是摧毀了人類的最後一點驕傲呢?
雖然作為多年的AI工作者,是AI的堅定支持者,我還是覺得人類的最後一道防線可以
多堅守一段時間。那麼,我來給李世石出點招吧。
這一切的一切,還是得先從AlphaGo的原理講起。
原理:AlphaGo如何運作?
區別於國際象棋靠推演,圍棋需要靠“感覺”。圍棋變化太多了,每一步棋可以有多
達300多種選擇。僅僅推演6-7步,就已經是現在電腦所不能及,更不用說人。所以,即便
是人,在很多場景下都要靠感覺來決定下一步往哪裡走。這種“感覺”,靠的是智力。
AlphaGo基於當今最領先的“深度學習”技術,來建立機器的智力。當前的這種人工
智慧技術,是一種仿生學技術,運用數學模型去模仿人類的大腦。這種機器大腦,在面對
棋局時也可以“感覺”出情勢的好壞。而“感覺”的好壞體現的就是智力水準。
那麼,智力水準怎麼比拼呢?通常我們數“腦細胞”的數量。就像人的腦細胞比狗多
,所以人比狗聰明;狗的腦細胞比蟑螂多,所以狗比蟑螂聰明。4年 前,Google就研發出
了一個腦細胞數量達到百萬量級的大腦Google Brain,能識別出貓臉。為此Google動用了
1000+台伺服器。
如果要讓機器大腦更聰明怎麼辦?一個直接的辦法就是,增加伺服器。伺服器數量增
加10倍,腦細胞數量就能增加10倍,機器大腦就更聰明了。
所以,AlphaGo有多聰明,主要看它有多少“腦細胞”。“腦細胞”的數量,主要看
投入了多少計算資源。
能力:AlphaGo有多厲害?
AlphaGo的智力水準肯定是不如人的。
4年前的Google Brain,腦細胞數量是人的萬分之一。雖然時過進遷,但Google的投
入仍然不可能達不到當年一萬倍。從第一盤比賽中,也可以看得出來,李世石在開局和佈
局是佔有優勢的。
第一盤棋中,真正讓人感到害怕的也不是AlphaGo的棋力,而是它的沒有情緒、不知
疲倦、沉著冷靜。這與AI無關,是機器的本性。
情緒、體力、心理波動等人性弱點對棋局結果的影響不可低估。事實上,李世石並不
輸在棋力,而是輸在獲得優勢以後的輕敵,以及之後所犯的錯誤。
勝機:李世石還有機會麼?
雙方對比來看,李世石比AlphaGo聰明,棋力更深厚。AlphaGo比李世石的人性弱點:
情緒控制更好,它不會緊張,不會沮喪, 也不會體力下降。李世石面對的其實是一位棋力比他稍差的忍者。好在,他是佔
據主動的一方。在棋力占優的情況下,只要不犯錯誤,是可以立於不敗之地的。
綜合來看,我仍然看好李世石。
和AlphaGo對抗時,人類需要注意的是:
1、AlphaGo所基於的人工智慧技術,強項不在於推演,而是借鑒過去見過的局面。所
以,如果要擊敗AlphaGo,需要盡可能把局面導向歷史上沒人下過的棋。
2、圍棋的邊角戰鬥靠計算,中空戰鬥靠感覺。既然感覺占優,那就一定要儘量把勝
負手留在棋盤中間(或許武宮正樹更適合pk AlphaGo?)。靠做“勢”取勝,而不是把戰
火引到邊角實地。
3、一旦進入到局部纏鬥,儘早將局部肉搏戰打完,不要留出大量小區域短兵相接的
局面,保持局面盡可能大開大合。
此外,需要格外小心的是,一定要克服自己人性的弱點。局面領先時,避免驕傲;落
後時,避免氣餒;膠著時,避免緊張。
李世石如果能在後面幾局注意控制自己的心魔:那麼不僅可以沉著冷靜,也可以小宇
宙爆發。相信後面還是有很大機會可以扳回。
總的來說,要戰勝AlphaGo:
1、準備歷史上沒下過的佈局;
2、把勝負手留在棋盤中間;
3、不留短兵相接的局面;
4、控制自己的心魔。
還有一點,可能是李世石犯的錯誤,但已無法改變了。據說,他要求下快棋。
AlphaGo系統的分為兩個部分,一是學習,二是對弈。其中,學習的 部分是最耗時間和資
源的,而對弈部分相對計算沒那麼大。要限制AlphaGo,應該要限制它的學習時間,而不
是對弈時的思考時間。特別是,對於 AlphaGo這樣的分散式系統,Google完全可以通過增
加一倍伺服器數量來讓落子速度倍增,而李世石是不可能給自己的大腦擴容的。其實,最
好的限制 AlphaGo的辦法是儘早與他對弈,不讓他繼續學習下去 :)
據說,柯潔已經發話說,AlphaGo下不過自己了。如果柯潔要鞏固自己的優勢,建議
如下。
建議
1、儘早與AlphaGo對弈
2、下慢棋
3、 或者還有一個不靠譜的招,改一下規則,下20*20的棋 :)
投入:AlphaGo花了多少錢?
最後,我想一個有意思的話題是,AlphaGo到底花了Google多少錢:)
從今天雙方在棋力上的差距來看,差距已經不是很大了。只要Google願意多投入5-10
倍的資源,AlphaGo的棋力應該可以超越人類了。要達到這樣的智力水準,我想Google應
該至少投入了數億美金的資源。
隨著技術水準的提升,和投入的加大,大概只需要1~2年,AlphaGo在棋力上應該也可
以超越人類。
寫到這裡,我其實還是很羡慕AlphaGo團隊的科學家的,他們有一個很好的sponsor,
能給他們一個環境去完成一件劃時代的壯舉——我何嘗不曾想擁有這樣的環境——3年前
我和我的老師楊強提出的圍棋方案找不到sponsor的場景仍然歷歷在目。
不過,後來我也想明白一個事情。其實我們的大環境缺的並不是有理想有抱負的科學
家,而是sponsor。所以真正挑戰人類的其實是IBM,不是許峰雄;是Google,不是
DeepMind團隊。就像,真正修成聖彼得大教堂的,是天主教會,而不是米開朗基羅。
這也是為什麼,我決定要做第四範式————中國有好的科學家,但缺好的sponsor。
http://sports.sina.com.cn/go/2016-03-10/doc-ifxqhmvc2261479.shtml
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.84.115
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457598918.A.D0C.html
推
03/10 16:36, , 1F
03/10 16:36, 1F
推
03/10 16:37, , 2F
03/10 16:37, 2F
推
03/10 16:37, , 3F
03/10 16:37, 3F
推
03/10 16:37, , 4F
03/10 16:37, 4F
→
03/10 16:37, , 5F
03/10 16:37, 5F
→
03/10 16:38, , 6F
03/10 16:38, 6F
推
03/10 16:38, , 7F
03/10 16:38, 7F
推
03/10 16:38, , 8F
03/10 16:38, 8F
→
03/10 16:39, , 9F
03/10 16:39, 9F
推
03/10 16:40, , 10F
03/10 16:40, 10F
推
03/10 16:42, , 11F
03/10 16:42, 11F
→
03/10 16:43, , 12F
03/10 16:43, 12F
→
03/10 16:43, , 13F
03/10 16:43, 13F
→
03/10 16:44, , 14F
03/10 16:44, 14F
推
03/10 16:44, , 15F
03/10 16:44, 15F
推
03/10 16:45, , 16F
03/10 16:45, 16F
→
03/10 16:45, , 17F
03/10 16:45, 17F
推
03/10 16:46, , 18F
03/10 16:46, 18F
推
03/10 16:46, , 19F
03/10 16:46, 19F
→
03/10 16:46, , 20F
03/10 16:46, 20F
→
03/10 16:47, , 21F
03/10 16:47, 21F
推
03/10 16:47, , 22F
03/10 16:47, 22F
推
03/10 16:47, , 23F
03/10 16:47, 23F
→
03/10 16:47, , 24F
03/10 16:47, 24F
推
03/10 16:48, , 25F
03/10 16:48, 25F
→
03/10 16:48, , 26F
03/10 16:48, 26F
推
03/10 16:48, , 27F
03/10 16:48, 27F
→
03/10 16:48, , 28F
03/10 16:48, 28F
→
03/10 16:49, , 29F
03/10 16:49, 29F
推
03/10 16:49, , 30F
03/10 16:49, 30F
→
03/10 16:50, , 31F
03/10 16:50, 31F
噓
03/10 16:52, , 32F
03/10 16:52, 32F
→
03/10 16:52, , 33F
03/10 16:52, 33F
→
03/10 16:52, , 34F
03/10 16:52, 34F
→
03/10 16:53, , 35F
03/10 16:53, 35F
推
03/10 16:53, , 36F
03/10 16:53, 36F
推
03/10 16:55, , 37F
03/10 16:55, 37F
噓
03/10 16:55, , 38F
03/10 16:55, 38F
→
03/10 16:56, , 39F
03/10 16:56, 39F
→
03/10 16:56, , 40F
03/10 16:56, 40F
推
03/10 16:56, , 41F
03/10 16:56, 41F
噓
03/10 17:00, , 42F
03/10 17:00, 42F
→
03/10 17:01, , 43F
03/10 17:01, 43F
噓
03/10 17:06, , 44F
03/10 17:06, 44F
推
03/10 17:08, , 45F
03/10 17:08, 45F
推
03/10 17:09, , 46F
03/10 17:09, 46F
推
03/10 17:12, , 47F
03/10 17:12, 47F
推
03/10 17:12, , 48F
03/10 17:12, 48F
推
03/10 17:13, , 49F
03/10 17:13, 49F
噓
03/10 17:14, , 50F
03/10 17:14, 50F
推
03/10 17:17, , 51F
03/10 17:17, 51F
→
03/10 17:17, , 52F
03/10 17:17, 52F
噓
03/10 17:28, , 53F
03/10 17:28, 53F
推
03/10 17:40, , 54F
03/10 17:40, 54F
噓
03/10 18:03, , 55F
03/10 18:03, 55F
噓
03/10 18:45, , 56F
03/10 18:45, 56F
推
03/10 19:09, , 57F
03/10 19:09, 57F
→
03/10 19:09, , 58F
03/10 19:09, 58F
噓
03/10 20:43, , 59F
03/10 20:43, 59F
→
03/10 21:49, , 60F
03/10 21:49, 60F