[新聞] 絕藝練成記:從虎虎有生氣到“絕藝”

看板GO作者 (逍遙山水憶秋年)時間7年前 (2017/03/20 06:08), 編輯推噓16(17111)
留言29則, 16人參與, 最新討論串1/1
絕藝練成記:從虎虎有生氣到“絕藝”   文章來源:騰訊科技微信公眾號   為了參加第十屆UEC比賽,未滿周歲的絕藝第一次出了國。   UEC杯是世界權威的圍棋大賽,每年在日本舉行,與普通圍棋賽不同,參賽選手不是 人類,全是AI。   身為參賽隊員之一的絕藝由騰訊AI Lab研發,打造這款圍棋AI出來的團隊,由13位年 輕人組成。   年輕是絕藝以及絕藝團隊的一個顯著特徵。   將絕藝與千里之外的日本UEC比賽現場連接起來只需一台電腦,通過筆記型電腦將絕 藝接入對戰系統,絕藝就能在圍棋機器人的世界裡與各方來賓一較高下了。   今年第10屆大賽共有30支軟體參賽。繼18日的迴圈積分賽中,“絕藝“以七局全勝戰 績進入16強後,在今天決賽又以四連勝戰績奪得本屆UEC杯冠軍,日本“DeepZenGo”獲亞 軍。3月26日,“絕藝”還將在東京與日本先鋒棋手一力遼在“電聖戰”中進行人機對弈 。 對大部分人而言,絕藝是一個顯得有些陌生的名字,這源於它從誕生到成長一直保持的低 調狀態。   儘管在它展露頭角的野狐圍棋對戰平臺上,絕藝的成長速度已經被外界注意到;而在 UEC上取得優異成果獲得更多關注後,絕藝及其背後的團隊依然神秘,為此我們對絕藝團 隊進行了專訪,以期還原絕藝的成長路。   從虎虎有生氣到“絕藝”   絕藝英文名FineArt,名出唐朝詩人杜牧的《重送絕句》——絕藝如君天下少,閒人 似我世間無。別後竹窗風雪夜,一燈明暗覆吳圖。頗具中國風的名字,契合圍棋起源於中 國的歷史。   一年前,絕藝還只是一個存在於團隊頭腦中的想法。   2016年1月28日,騰訊AI Lab高級總監、專家工程師劉永升在內部IM上收到一條來自 騰訊副總裁姚星的消息:有沒有信心做圍棋AI,如果圍棋不行,先做象棋AI也行。   姚星之所以萌生做圍棋AI的想法,源於他認為做這個對鍛煉團隊的研發能力有幫助, 而且跟騰訊相關的應用前景很大。   彼時劉永升對圍棋AI還沒有太清晰的概念,於是答覆姚星好好調研。在當年春節假期 ,劉永升找了一些圍棋的書籍、論文閱讀,對圍棋AI有了基本瞭解。春節回來後,2月17 日,姚星問圍棋AI有沒有在做,劉回答:還在調研,並承諾一個月後出DEMO。   2016年3月4日,第一個DEMO完成,棋力在業餘5級左右,到3月下旬,圍棋AI正式立項 ,項目名稱weigo,團隊也隨之搭建起來。   到2016年6月下旬,絕藝棋力突破業務6段,意即突破業餘高手水準,這是絕藝的一個 重要發展節點。   2016年8月,絕藝以“虎虎有生氣”的ID首次在野狐平臺(騰訊旗下圍棋對弈平臺) 下棋,8月23日首次戰勝職業棋手,9月4日,絕藝以“野狐掃地僧”ID連贏 ID為tby的網 友8局,tby是聶衛平長子孔令文的帳號。   在不斷的學習中,絕藝的能力不斷增強。   11月1日,絕藝正式以“絕藝”ID亮相野狐,11月2日第一次戰勝世界冠軍江維傑(野 狐ID若水雲寒)。   11月19日晚,“絕藝”首次和柯潔交手,一勝一負;11月28日,“絕藝”對韓國第一 人樸廷桓5勝1負。2017年2月14日以後,絕藝對野狐帽子(世界冠軍和全國冠軍)的勝率 ,已經能夠穩定在90%以上。   這個資料意味著,絕藝長大了。   絕藝是這樣“煉成”的   人工智慧究竟是如何學習怎樣下圍棋的?回顧絕藝從0到1的過程能夠得到解答。   據絕藝團隊介紹,絕藝的學習方式包含兩部分,一部分來自人類棋譜,通過深度卷積 網路的訓練,得到一個策略網路;第二部分為自對弈棋譜,也通過深度卷積網路訓練,得 到一個估值網路。   怎樣把人類的棋譜“喂”給絕藝,而絕藝又是如何理解人類棋譜的?首先絕藝團隊會 把人類過往棋譜轉化為若干二維矩陣,作為深度卷積網路的輸入,輸出成果是一個 策略 網路。策略網路的作用在於,當你再輸入一個從來沒有存在過的新棋局時,策略網路可以 返回若干候選點,並且為每個候選點計算相應的概率值。   在絕藝的成長過程中,與人類棋手對弈是絕藝強大起來的重要原因,絕藝的突破性進 展總是伴隨其戰勝某一實力水準的棋手出現。   “我們在6月底戰勝業餘強豪,8月初首次戰勝職業初級選手,9月首次戰勝職業普通 選手,11月首次戰勝職業高級選手。”   在11月份輸給煉心(時越)之後,絕藝閉關了一段時間,主要是大幅度提升了價值網 路的精度,隨後以刑天的ID再次亮相。   在絕藝團隊看來,與人類棋手對弈的意義在於,在研發過程中,如何評估棋力以及存 在哪些問題是非常困難的,並且隨著絕藝棋力提升,普通的棋手基本無法戰勝的時候更難 暴露其不足。所以,絕藝的研發過程中得益於世界超一流棋手的指導,非常難能可貴,對 研發進度有非常大的説明。   儘管身為絕藝的研發人員,在開發絕藝的過程中,團隊成員依然對AI的強大感到驚喜 。   “我們從來沒有想像AI可以這麼強,很多很複雜的棋,真不知道它為什麼可以正確應 對,只能說深度神經網路真的很神奇。”   在不斷的學習中,絕藝的棋力已經成長到足夠讓一流棋手另眼相看的程度。2016年11 月19日晚上,絕藝和柯潔下了兩局,第一局絕藝第一次戰勝圍棋第一人柯潔,第二局惜敗 。下完,柯潔發了一個朋友圈,內容是:“下的全是汗…\冷汗”。   團隊愛把絕藝比作一個可愛的小孩。   在3月17日絕藝與crazystone的對弈中,下到19手時,團隊成員看了絕藝的表現忍不 住評價:絕藝又要動粗,要直接一本(柔道術語,意思是直接結束戰鬥)。  AI在圍棋上的成就已經得到普遍認可,但圍棋AI的存在並不意味著會成為人類棋手終結 者。   絕藝團隊認為,絕藝是帶動人類認識圍棋的新力量,它與其他AI不是競爭對手,而是 共同推動人類對圍棋的認知。   事實上,圍棋AI確實能給人類棋手帶來一些新角度的啟發。   在一手打造了絕藝的團隊成員看來,經過多次人機對弈後,他們發現,人類棋手與圍 棋AI各有特點:“人類比較狡猾,但人類容易犯錯;機器比較老實,但幾乎不犯錯。”   同時,絕藝的大局觀,以及對一些定式的變換是能夠給人類棋手不少啟發的。   而開發圍棋AI的意義並不局限於圍棋領域。   從團隊角度看來,研發絕藝促使團隊過去幾年在AI演算法研究、大規模計算平臺以及 工程能力得到一次檢閱,並對深度學習和強化學習等AI熱門研究領域有了很多有價值的探 索與創新。   從技術角度看,絕藝背後的人工智慧技術是“精准決策”的能力,有非常廣闊的應用 場景,如無人駕駛、量化金融、輔助醫療等。   對絕藝團隊而言,絕藝當前取得的成果一方面完善了騰訊AI基礎設施,鍛煉了團隊, 也大大提升了技術視野,強化了團隊的信心。另一方面,絕藝給了他們向更廣闊AI領域積 極進軍的信心,隨著團隊對AI的研究不斷深入,AI在其他領域的更多可能將被逐漸挖掘。   事實上,絕藝只是騰訊人工智慧戰略的一個體現。   2016年4月,騰訊成立AI Lab(騰訊人工智慧實驗室),致力於人工智慧基礎科學的 開放研究,以及應用領域的深入探索,做到“學術有影響,工業有產出”。   實驗室的願景是打造騰訊全面AI競爭力,讓人工智慧未來無處不在(Make AI Everywhere)。   目前實驗室有50余位世界知名學院的AI科學家(90%為博士)、及200多位經驗豐富的 工程師進行基礎研究與應用探索。   AI Lab聚焦四大領域的基礎研究,包括:電腦視覺、語音辨識、自然語言處理與機器 學習,力求全面覆蓋並深層次拓展AI的前沿技術能力。同時發展AI在具有騰訊特色的四大 業務場景中的應用能力:內容 AI、社交AI、遊戲AI和平臺工具AI。   目前產品已應用在上百個騰訊產品上,在絕藝之後,騰訊於AI領域的佈局、研究和應 用,已經進入加速時代。 http://sports.sina.com.cn/go/2017-03-19/doc-ifycnpiu9110991.shtml -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.114.161 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1489961321.A.7A1.html

03/20 06:54, , 1F
好文 真希望台灣也有大公司致力於AI發展......
03/20 06:54, 1F

03/20 07:54, , 2F
台灣有要發展的話,會想去試一試
03/20 07:54, 2F

03/20 10:48, , 3F
這一定要燒很多錢...台灣公司不太可能做吧XD
03/20 10:48, 3F

03/20 11:43, , 4F
100億日圓
03/20 11:43, 4F

03/20 11:53, , 5F
看錯,是10億日圓
03/20 11:53, 5F

03/20 12:42, , 6F
去年alphgo熱潮 CGI團體的吳教授也有呼籲政府注重
03/20 12:42, 6F

03/20 13:35, , 7F
台灣就算了吧.. 先搞好自己的圍棋
03/20 13:35, 7F

03/20 13:36, , 8F
多把錢花在培育選手上 雖然現在政府不太可能就是了
03/20 13:36, 8F

03/20 13:45, , 9F
台灣圍棋拿世界冠軍可能性比棒球拿經典賽冠軍好像要高XD
03/20 13:45, 9F

03/20 14:15, , 10F
能進8強就不錯了....
03/20 14:15, 10F

03/20 14:23, , 11F
絕口不提參考AlphaGo論文,這是一篇騰訊廣告文罷了
03/20 14:23, 11F

03/20 14:29, , 12F
光硬體差距就不知道差多少了
03/20 14:29, 12F

03/20 16:29, , 13F
棒球進8強可能就舉國高潮 圍棋世界亞軍可能也沒人理 XDDD
03/20 16:29, 13F

03/20 17:14, , 14F
你看有多少人知道周俊勳...
03/20 17:14, 14F

03/20 17:33, , 15F
周拿完1次後 之後呢 就淡出了....
03/20 17:33, 15F

03/20 17:39, , 16F
其實只要DeepMind之後不發論文 騰訊要追上根本不可能
03/20 17:39, 16F

03/20 17:40, , 17F
DeepMind那些人全是RL學術界的大師
03/20 17:40, 17F

03/20 18:07, , 18F
之後各國AI差距會慢慢變小 人類各國的差距卻越來越大
03/20 18:07, 18F

03/20 19:37, , 19F
1.我看了alphago的論文 2.我很有錢
03/20 19:37, 19F

03/20 19:37, , 20F
文章講的好像整個點子是團隊想到一樣
03/20 19:37, 20F

03/20 23:02, , 21F
葉佩雯
03/20 23:02, 21F

03/21 01:30, , 22F
全文不提alphago怪怪的
03/21 01:30, 22F

03/21 10:28, , 23F
老聶長子不同姓? 入贅?
03/21 10:28, 23F

03/21 10:28, , 24F
第一次知道
03/21 10:28, 24F

03/21 10:57, , 25F
老聶離婚後﹐長子和母姓了
03/21 10:57, 25F

04/02 13:09, , 26F
文中提到了 16年1月成立AI團隊研發棋類AI 3月份才有人機
04/02 13:09, 26F

04/02 13:09, , 27F
大戰 為什麼說一定偷學的
04/02 13:09, 27F

04/02 20:00, , 28F
因為實作是用Deepmind的論文去進行的,當然論文不會
04/02 20:00, 28F

04/02 20:00, , 29F
鉅細靡遺,可是至少大方向是不會變的。
04/02 20:00, 29F
文章代碼(AID): #1Opm5fUX (GO)