[新聞] 人類如何反轉？人工智慧專家給李世石出招

看板GO作者zkow (逍遙山水憶秋年)時間8年前 (2016/03/10 16:35)推噓19(28推 9噓 23→)

留言60則, 41人參與討論串1/1

人類如何反轉？人工智慧專家給李世石出點招　作者：戴文淵　　如果說1997年IBM深藍戰勝國際象棋世界冠軍卡斯帕羅夫是機器突破了人類的第一道防線話，2016年AlphaGo是不是摧毀了人類的最後一點驕傲呢？　　雖然作為多年的AI工作者，是AI的堅定支持者，我還是覺得人類的最後一道防線可以多堅守一段時間。那麼，我來給李世石出點招吧。　　這一切的一切，還是得先從AlphaGo的原理講起。　　原理：AlphaGo如何運作？　　區別於國際象棋靠推演，圍棋需要靠“感覺”。圍棋變化太多了，每一步棋可以有多達300多種選擇。僅僅推演6-7步，就已經是現在電腦所不能及，更不用說人。所以，即便是人，在很多場景下都要靠感覺來決定下一步往哪裡走。這種“感覺”，靠的是智力。　　AlphaGo基於當今最領先的“深度學習”技術，來建立機器的智力。當前的這種人工智慧技術，是一種仿生學技術，運用數學模型去模仿人類的大腦。這種機器大腦，在面對棋局時也可以“感覺”出情勢的好壞。而“感覺”的好壞體現的就是智力水準。　　那麼，智力水準怎麼比拼呢？通常我們數“腦細胞”的數量。就像人的腦細胞比狗多，所以人比狗聰明；狗的腦細胞比蟑螂多，所以狗比蟑螂聰明。4年前，Google就研發出了一個腦細胞數量達到百萬量級的大腦Google Brain，能識別出貓臉。為此Google動用了 1000+台伺服器。　　如果要讓機器大腦更聰明怎麼辦？一個直接的辦法就是，增加伺服器。伺服器數量增加10倍，腦細胞數量就能增加10倍，機器大腦就更聰明了。　　所以，AlphaGo有多聰明，主要看它有多少“腦細胞”。“腦細胞”的數量，主要看投入了多少計算資源。　　能力：AlphaGo有多厲害？　　AlphaGo的智力水準肯定是不如人的。　　4年前的Google Brain，腦細胞數量是人的萬分之一。雖然時過進遷，但Google的投入仍然不可能達不到當年一萬倍。從第一盤比賽中，也可以看得出來，李世石在開局和佈局是佔有優勢的。　　第一盤棋中，真正讓人感到害怕的也不是AlphaGo的棋力，而是它的沒有情緒、不知疲倦、沉著冷靜。這與AI無關，是機器的本性。　　情緒、體力、心理波動等人性弱點對棋局結果的影響不可低估。事實上，李世石並不輸在棋力，而是輸在獲得優勢以後的輕敵，以及之後所犯的錯誤。　　勝機：李世石還有機會麼？　　雙方對比來看，李世石比AlphaGo聰明，棋力更深厚。AlphaGo比李世石的人性弱點：情緒控制更好，它不會緊張，不會沮喪，也不會體力下降。李世石面對的其實是一位棋力比他稍差的忍者。好在，他是佔據主動的一方。在棋力占優的情況下，只要不犯錯誤，是可以立於不敗之地的。　　綜合來看，我仍然看好李世石。　　和AlphaGo對抗時，人類需要注意的是：　　1、AlphaGo所基於的人工智慧技術，強項不在於推演，而是借鑒過去見過的局面。所以，如果要擊敗AlphaGo，需要盡可能把局面導向歷史上沒人下過的棋。　　2、圍棋的邊角戰鬥靠計算，中空戰鬥靠感覺。既然感覺占優，那就一定要儘量把勝負手留在棋盤中間（或許武宮正樹更適合pk AlphaGo？）。靠做“勢”取勝，而不是把戰火引到邊角實地。　　3、一旦進入到局部纏鬥，儘早將局部肉搏戰打完，不要留出大量小區域短兵相接的局面，保持局面盡可能大開大合。　　此外，需要格外小心的是，一定要克服自己人性的弱點。局面領先時，避免驕傲；落後時，避免氣餒；膠著時，避免緊張。　　李世石如果能在後面幾局注意控制自己的心魔：那麼不僅可以沉著冷靜，也可以小宇宙爆發。相信後面還是有很大機會可以扳回。　　總的來說，要戰勝AlphaGo：　　1、準備歷史上沒下過的佈局；　　2、把勝負手留在棋盤中間；　　3、不留短兵相接的局面；　　4、控制自己的心魔。　　還有一點，可能是李世石犯的錯誤，但已無法改變了。據說，他要求下快棋。 AlphaGo系統的分為兩個部分，一是學習，二是對弈。其中，學習的部分是最耗時間和資源的，而對弈部分相對計算沒那麼大。要限制AlphaGo，應該要限制它的學習時間，而不是對弈時的思考時間。特別是，對於 AlphaGo這樣的分散式系統，Google完全可以通過增加一倍伺服器數量來讓落子速度倍增，而李世石是不可能給自己的大腦擴容的。其實，最好的限制 AlphaGo的辦法是儘早與他對弈，不讓他繼續學習下去：）　　據說，柯潔已經發話說，AlphaGo下不過自己了。如果柯潔要鞏固自己的優勢，建議如下。　　建議　　1、儘早與AlphaGo對弈　　2、下慢棋　　3、或者還有一個不靠譜的招，改一下規則，下20*20的棋：）　　投入：AlphaGo花了多少錢？　　最後，我想一個有意思的話題是，AlphaGo到底花了Google多少錢：）　　從今天雙方在棋力上的差距來看，差距已經不是很大了。只要Google願意多投入5-10 倍的資源，AlphaGo的棋力應該可以超越人類了。要達到這樣的智力水準，我想Google應該至少投入了數億美金的資源。　　隨著技術水準的提升，和投入的加大，大概只需要1~2年，AlphaGo在棋力上應該也可以超越人類。　　寫到這裡，我其實還是很羡慕AlphaGo團隊的科學家的，他們有一個很好的sponsor，能給他們一個環境去完成一件劃時代的壯舉——我何嘗不曾想擁有這樣的環境——3年前我和我的老師楊強提出的圍棋方案找不到sponsor的場景仍然歷歷在目。　　不過，後來我也想明白一個事情。其實我們的大環境缺的並不是有理想有抱負的科學家，而是sponsor。所以真正挑戰人類的其實是IBM，不是許峰雄；是Google，不是 DeepMind團隊。就像，真正修成聖彼得大教堂的，是天主教會，而不是米開朗基羅。　這也是為什麼，我決定要做第四範式————中國有好的科學家，但缺好的sponsor。 http://sports.sina.com.cn/go/2016-03-10/doc-ifxqhmvc2261479.shtml -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.84.115 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457598918.A.D0C.html

推

shooooooboom

03/10 16:36, , 1^F

03/10 16:36, 1^F

推

BATTLAX

03/10 16:37, , 2^F

03/10 16:37, 2^F

推

emperor

03/10 16:37, , 3^F

03/10 16:37, 3^F

推

sassuck

03/10 16:37, , 4^F

03/10 16:37, 4^F

→

sassuck

03/10 16:37, , 5^F

03/10 16:37, 5^F

→

KotoriCute

03/10 16:38, , 6^F

03/10 16:38, 6^F

推

POCARI5566

03/10 16:38, , 7^F

03/10 16:38, 7^F

推

Rueyh

03/10 16:38, , 8^F

03/10 16:38, 8^F

→

Rueyh

03/10 16:39, , 9^F

03/10 16:39, 9^F

推

shooooooboom

03/10 16:40, , 10^F

03/10 16:40, 10^F

推

birdy590

03/10 16:42, , 11^F

03/10 16:42, 11^F

→

birdy590

03/10 16:43, , 12^F

03/10 16:43, 12^F

→

birdy590

03/10 16:43, , 13^F

03/10 16:43, 13^F

→

OrzJ

03/10 16:44, , 14^F

03/10 16:44, 14^F

推

ComicMan

03/10 16:44, , 15^F

03/10 16:44, 15^F

推

orze04

03/10 16:45, , 16^F

03/10 16:45, 16^F

→

KurakiMaki

03/10 16:45, , 17^F

03/10 16:45, 17^F

推

darren2586

03/10 16:46, , 18^F

03/10 16:46, 18^F

推

DreamFly0811

03/10 16:46, , 19^F

03/10 16:46, 19^F

→

DreamFly0811

03/10 16:46, , 20^F

03/10 16:46, 20^F

→

NaoGaTsu

03/10 16:47, , 21^F

03/10 16:47, 21^F

推

orze04

03/10 16:47, , 22^F

03/10 16:47, 22^F

推

ParuruChan

03/10 16:47, , 23^F

03/10 16:47, 23^F

→

NaoGaTsu

03/10 16:47, , 24^F

03/10 16:47, 24^F

推

ginstein

03/10 16:48, , 25^F

03/10 16:48, 25^F

→

NaoGaTsu

03/10 16:48, , 26^F

03/10 16:48, 26^F

推

bcqqa7785

03/10 16:48, , 27^F

03/10 16:48, 27^F

→

bcqqa7785

03/10 16:48, , 28^F

03/10 16:48, 28^F

→

zseineo

03/10 16:49, , 29^F

03/10 16:49, 29^F

推

arnold3

03/10 16:49, , 30^F

03/10 16:49, 30^F

→

NaoGaTsu

03/10 16:50, , 31^F

03/10 16:50, 31^F

噓

druid0214

03/10 16:52, , 32^F

03/10 16:52, 32^F

→

zseineo

03/10 16:52, , 33^F

03/10 16:52, 33^F

→

druid0214

03/10 16:52, , 34^F

03/10 16:52, 34^F

→

druid0214

03/10 16:53, , 35^F

03/10 16:53, 35^F

推

ColdM

03/10 16:53, , 36^F

03/10 16:53, 36^F

推

enoch3300038

03/10 16:55, , 37^F

03/10 16:55, 37^F

噓

jet113102

03/10 16:55, , 38^F

03/10 16:55, 38^F

→

zkow

03/10 16:56, , 39^F

03/10 16:56, 39^F

→

enoch3300038

03/10 16:56, , 40^F

03/10 16:56, 40^F

推

DiAbLoE

03/10 16:56, , 41^F

03/10 16:56, 41^F

噓

gj942l41l4

03/10 17:00, , 42^F

03/10 17:00, 42^F

→

gj942l41l4

03/10 17:01, , 43^F

03/10 17:01, 43^F

噓

Mojear

03/10 17:06, , 44^F

03/10 17:06, 44^F

推

lwei781

03/10 17:08, , 45^F

03/10 17:08, 45^F

推

KurakiMaki

03/10 17:09, , 46^F

03/10 17:09, 46^F

推

ckuser

03/10 17:12, , 47^F

03/10 17:12, 47^F

推

ilw4e

03/10 17:12, , 48^F

03/10 17:12, 48^F

推

broodworld

03/10 17:13, , 49^F

03/10 17:13, 49^F

噓

RoundKick

03/10 17:14, , 50^F

03/10 17:14, 50^F

推

tsai18

03/10 17:17, , 51^F

03/10 17:17, 51^F

→

tsai18

03/10 17:17, , 52^F

03/10 17:17, 52^F

噓

Ommm5566

03/10 17:28, , 53^F

03/10 17:28, 53^F

推

allimontti

03/10 17:40, , 54^F

03/10 17:40, 54^F

噓

blackwindy

03/10 18:03, , 55^F

03/10 18:03, 55^F

噓

semihumanity

03/10 18:45, , 56^F

03/10 18:45, 56^F

推

Noel7788

03/10 19:09, , 57^F

03/10 19:09, 57^F

→

Noel7788

03/10 19:09, , 58^F

03/10 19:09, 58^F

噓

leafwind

03/10 20:43, , 59^F

03/10 20:43, 59^F

→

fcfcegr

03/10 21:49, , 60^F

03/10 21:49, 60^F

‣ 返回看板[ GO ] 棋類

‣ 更多 zkow 的文章

文章代碼(AID): #1MuJ76qC (GO)