[新聞] AlphaGo成功關鍵 黃士傑:策略結合值網路

看板GO作者 (^^)時間8年前 (2016/03/18 23:43), 8年前編輯推噓3(304)
留言7則, 5人參與, 最新討論串1/1
AlphaGo成功關鍵 黃士傑:策略結合值網路 http://i.epochtimes.com/assets/uploads/2016/03/1603181042202544.jpg
黃士傑解說機器學習如何讓AlphaGo自我學習。(陳懿勝/大紀元) 【大紀元2016年03月18日訊】(大紀元記者陳懿勝台灣台北報導)谷歌( Google)旗下DeepMind開發的人工智慧系統「AlphaGo」,日前以4:1大勝韓 國九段圍棋高手、世界冠軍李世石。AlphaGo主要開發者、來自台灣的黃志傑 18日返台及分享經驗,他表示,AlphaGo成功的主要關鍵在於策略網路( Policy Network)與值網路(Value Network)的分析方式,讓它能在20~30 萬份對戰棋譜中,找出最好的20步,才能夠在此世紀之戰中獲勝。 黃志傑指出,圍棋第一步的下法選擇就高達361種,變化數有10的364次方, 對早期人工智慧來說,根本無法計算。但對AlphaGo來說,運用策略網路來減 少搜尋廣度,從360步只要找到20步;價值網路則是直接判斷盤面狀況,了解 優勢還是劣勢,減少搜索深度,自然會提升勝率。 對於第四局對戰AlphaGo落敗,黃志傑說,當時李世石下了神之一手,以致值 網路發生誤判,接連處在劣勢。由於AlphaGo會在比賽中隨時計算勝率,如果 勝率低於20%就會投降,但為何會誤判,目前仍不清楚詳細原因。 黃志傑說,當AlphaGo通知投降時,他自己有笑了一下,因為他很尊敬李世石 ,看過李世石大部分的棋譜與比賽,很榮幸能夠坐在他對面。「我為李世石 高興,因為知道他的壓力很大,4比1是蠻圓滿的結果。」 至於AlphaGo的未來發展,黃志傑表示,未來人工智慧可望運用在醫療及機器 人上,並達到預先診斷、找出病徵,協助醫學診斷。◇ 新聞網址:http://www.epochtimes.com/b5/16/3/18/n4666018.htm -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.228.119.147 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1458315782.A.49F.html ※ 編輯: amix (220.141.125.110), 03/18/2016 23:49:00

03/19 09:19, , 1F
結果1萬個人有1個人出錯,就被告不完了,這是現在醫生的
03/19 09:19, 1F

03/19 09:19, , 2F
困境
03/19 09:19, 2F

03/19 11:15, , 3F
黃志傑是誰?
03/19 11:15, 3F

03/19 11:58, , 4F
球給
03/19 11:58, 4F

03/19 19:54, , 5F
連名字都寫錯 這記者…
03/19 19:54, 5F

03/20 09:31, , 6F
其實這點大公司比個人醫生有利,因為大公司可以買保險
03/20 09:31, 6F

03/20 09:31, , 7F
一萬人才出錯一次的話說不定保險就完全理賠完,根本不怕~
03/20 09:31, 7F
文章代碼(AID): #1Mx286IV (GO)