Fw: [新聞]AlphaGo戰勝棋王的秘密?DeepMind成員來台

看板GO作者 (一坪的海岸線)時間8年前 (2016/03/18 14:05), 8年前編輯推噓12(12017)
留言29則, 15人參與, 最新討論串1/1
※ [本文轉錄自 Gossiping 看板 #1MwvWCd5 ] 作者: buke (一坪的海岸線) 看板: Gossiping 標題: [新聞]AlphaGo戰勝棋王的秘密?DeepMind成員來台 時間: Fri Mar 18 13:54:02 2016 1.媒體來源: 自由 2.完整新聞標題: AlphaGo 戰勝棋王的秘密?DeepMind 成員來台現身說法! 3.完整新聞內文: 作為人工智慧開發的新里程碑,Google 旗下 DeepMind 團隊所開發的 AlphaGo 系統,在 最近一場與世界棋王頂尖對決中,最終以 4 比 1 拿下勝利,並且榮登世界棋士排行榜第 二名的位置。這場讓世人見證到人工智慧的高速發展的賽事,也讓幕後開發 AlphaGo 的 DeepMind 團隊立時成為受矚目對象。其中來自台灣的 DeepMind 成員、同時也是代 Alph aGo 在棋盤上落子的黃士傑,今天親臨 Google 台灣,要來分享 AlphaGo 的致勝關鍵! 來自台灣的黃士傑,目前是 Google 旗下 DeepMind 團隊的資深研究員,也是 AlphaGo 人 工智慧系統的重要開發者。而能夠成為 AlphaGo 的關鍵人物。曾經開發過圍棋人工智慧、 做過圍棋老師的他,認為圍棋是相當適合 AI 人工智慧的挑戰,特別是在深藍在 1997 年 擊敗人類後,圍棋成為 AI 人工智慧仍未取勝的領域。 其中 AlphaGo 之所以能獲勝,最主要的原因在於可以「判斷優勢」、「以及取得最佳的棋 路」兩大要素,透過學習人類千年來智慧的結晶,學習大量的棋譜與棋路,因此可以擁有 類似人類的「直覺」下法,無須窮舉運算所有的棋路,就可以決定哪一個落子處,最有機 會獲的勝利。 其中黃士傑表示,「直覺」是圍棋比賽中最重要的關鍵,職業棋士總會有神來一著,但他 們也無從說起判斷為何。黃士傑指出,這就是「直覺」的重要性,透過優先找出更有優勢 、勝率更高的棋路,讓電腦不必窮盡所有棋路可能,而可以選擇最有勝率的 20 步,以採 取勝率最高的策略。 黃士傑提到,由於圍棋的變化有 10 的 170 次方,若是想要把所有的棋路窮盡思量,那麼 幾億年也無法運算完。因此 AlphaGo 採取可以判斷優勢的「策略網路」,輔以可以推斷棋 路的「價值網路」,讓 AlphaGo 能擁有類似人類的直覺,以便在圍棋這類複雜的棋類運動 中,與人類對弈、進一步取得勝利! 黃士傑表示,在 1990 年時,人工智慧還無法做到與人類較量圍棋的能力,當時儘管讓 AI 先下 25 個旗子,但仍會在最後全部被吃光落敗。時至今日透過 Google 機器學習技術的 幫助,AI 的發展已經突飛猛進,在這次與李世石的對弈中,甚至獲得 5 戰 4 勝的成績。 不過回顧比賽當時、坐在李世石對面的黃士傑,其實是抱著相當尊敬的心情與李世石對弈 。包含避免喝水、離席、以及過多的臉部表情,都是基於尊敬李世石、不想要干擾他的比 賽而產生的行為,這更讓賽後李世石提到,與他對弈的黃士傑有著職業棋手的氣勢。黃士 傑表示,在賽中他可能只有意外地笑了一次,而那次是因為李世石擊敗了 AlphaGo,他由 衷為李世石感到開心的笑容。 然而面對李世石在第四局的 79 手落子,為何最終會導致 AlphaGo 的誤判、導致這個人工 智慧最後選擇投降,黃士傑表示這確實可能是 AlphaGo 的 BUG,但目前還不清楚是策略網 路的誤判、還是價值網路提供了錯誤的訊息,DeepMind 團隊還在研究導致戰敗的原因。 說到戰敗,黃士傑提到其實 AlphaGo 只要覺得「沒希望了」,就會主動投降,也就是在勝 率低於 20% 的情況下,系統會彈出投降視窗,也就是在第四戰大家看到的畫面。但這並非 意味著 AlphaGo 有辦法事前預測和李世石對弈時,可能獲勝的機率有多少。黃士傑強調, AlphaGo 的勝率判斷,必須基於和對方正式交手後才能判斷,因此在還沒比賽前,AlphaGo 自己也不知道獲勝的機會有多大。 而這種判斷機制,也讓 AlphaGo 在第五戰成功逆轉勝。除了因為學習了李世石在前四戰的 棋路外,先前透過兩個 AlphaGo 系統的自主對弈訓練,也是讓這個人工智慧系統有著超越 人類圍棋能力的關鍵。 未來 AlphaGo 有機會應用在其他領域上,特別是醫療領域,DeepMind 已經有團隊特別在 進行這方面的項目。但對於人工智慧不斷發展,是否會出現類似「天網」的人工智慧威脅 ?黃士傑強調,人工智慧的使用依舊取決於人類如何使用,而 DeepMind 團隊也相當重視 這個問題,Google 內部甚至有倫理委員會,來決定科技的使用方式是否正確。 至於 AlphaGo 未來會不會挑戰其他項目,像是《星海爭霸》這類的即時戰略遊戲?黃士傑 認為短時間內不可能,主要原因是即時戰略遊戲不同圍棋,他有太多不確定的因素,對於 人工智慧而言還太過困難。他特別指出,人工智慧目前人仍是早期階段,還沒有辦法創造 出主動式的意識,因此未來還有很長的路要走。 4.完整新聞連結 (或短網址): http://3c.ltn.com.tw/news/23480?page=1 5.備註: 連結內有完整影片 ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.230.153.2 ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1458280460.A.9C5.html ※ 編輯: buke (36.230.153.2), 03/18/2016 14:07:16

03/18 14:13, , 1F
一直拍人不拍投影片...- - 雖然人很重要 但也不用拍整場吧?
03/18 14:13, 1F

03/18 15:32, , 2F
投影片沒新內容吧,跟水管deepmind頻道的第一則影片一樣
03/18 15:32, 2F

03/18 17:10, , 3F
所以每次跟李對奕都會再自我學習。
03/18 17:10, 3F

03/18 17:23, , 4F
很懷疑新聞裡三樓那段是不是新聞自己加的 影片沒聽到
03/18 17:23, 4F

03/18 17:24, , 5F
這次對弈應該會避免深藍時的爭議 對戰期間不調整參數
03/18 17:24, 5F

03/18 20:21, , 6F
參數在比賽期間不會調整 這點 aja 有說過...
03/18 20:21, 6F

03/18 20:35, , 7F
你的調整看是什麼角度 對工程師而言 調整是修改code
03/18 20:35, 7F

03/18 20:37, , 8F
不然就是調參數 不過AlphaGo會自己優化參數
03/18 20:37, 8F

03/18 21:38, , 9F
樓上沒聽懂? 參數在比賽期間就是定死的
03/18 21:38, 9F

03/18 21:46, , 10F
這裡的調整參數 應該指的是類神經網路的學習 不是工程
03/18 21:46, 10F

03/18 21:47, , 11F
師調參數 而是暫時停止學習 固定住NN現況來下
03/18 21:47, 11F

03/18 21:48, , 12F
不過賽後 照理說會對失敗的那盤做點學習就是了
03/18 21:48, 12F

03/18 21:51, , 13F
如果挑戰 mud,例如像「重生的世界」 Revival World 呢?
03/18 21:51, 13F

03/18 22:39, , 14F
他們就只有說版本是定死的 有說比賽期間不會自己下嗎
03/18 22:39, 14F

03/18 22:43, , 15F
我是沒注意到他有沒有說有繼續對練 但跟聽不聽懂無關
03/18 22:43, 15F

03/18 22:46, , 16F
當然也可能只是記者改寫時誤傳
03/18 22:46, 16F

03/18 23:40, , 17F
第四局李世石持白,怎麼可能下到「78」手......|||
03/18 23:40, 17F

03/18 23:51, , 18F
說錯 是他怎麼可能下到「79」手
03/18 23:51, 18F

03/19 00:07, , 19F
Machine learning就是每跑一次棋譜(下棋)會比前一次強
03/19 00:07, 19F

03/19 00:07, , 20F
版本定死意思就是在這午盤其中間AlphaGo不會再自我學
03/19 00:07, 20F

03/19 00:07, , 21F
03/19 00:07, 21F

03/19 00:08, , 22F
*五盤棋
03/19 00:08, 22F

03/19 00:26, , 23F
倒數第三段有提到學習了李世石在前四戰的棋路,所以
03/19 00:26, 23F

03/19 00:26, , 24F
期間還是有放給它自己成長。
03/19 00:26, 24F

03/19 01:08, , 25F
所以意思是alphaGO比賽期間只用和李世石對弈來學習?
03/19 01:08, 25F

03/19 01:38, , 26F
你怎麼知道那段不是記者自己腦補的...
03/19 01:38, 26F

03/19 04:55, , 27F
記得之前都說比賽中不會重學,那句我覺得是記者腦補
03/19 04:55, 27F

03/19 10:44, , 28F
和李世石下的那幾盤對AlphaGo 沒影響,他要幾百萬盤
03/19 10:44, 28F

03/19 10:44, , 29F
才會有影響
03/19 10:44, 29F
文章代碼(AID): #1Mwvgd0u (GO)