[新聞] 絕藝練成記：從虎虎有生氣到“絕藝”

看板GO作者zkow (逍遙山水憶秋年)時間7年前 (2017/03/20 06:08)推噓16(17推 1噓 11→)

留言29則, 16人參與討論串1/1

絕藝練成記：從虎虎有生氣到“絕藝” 　　文章來源：騰訊科技微信公眾號　　為了參加第十屆UEC比賽，未滿周歲的絕藝第一次出了國。　　UEC杯是世界權威的圍棋大賽，每年在日本舉行，與普通圍棋賽不同，參賽選手不是人類，全是AI。　　身為參賽隊員之一的絕藝由騰訊AI Lab研發，打造這款圍棋AI出來的團隊，由13位年輕人組成。　　年輕是絕藝以及絕藝團隊的一個顯著特徵。　　將絕藝與千里之外的日本UEC比賽現場連接起來只需一台電腦，通過筆記型電腦將絕藝接入對戰系統，絕藝就能在圍棋機器人的世界裡與各方來賓一較高下了。　　今年第10屆大賽共有30支軟體參賽。繼18日的迴圈積分賽中，“絕藝“以七局全勝戰績進入16強後，在今天決賽又以四連勝戰績奪得本屆UEC杯冠軍，日本“DeepZenGo”獲亞軍。3月26日，“絕藝”還將在東京與日本先鋒棋手一力遼在“電聖戰”中進行人機對弈。對大部分人而言，絕藝是一個顯得有些陌生的名字，這源於它從誕生到成長一直保持的低調狀態。　　儘管在它展露頭角的野狐圍棋對戰平臺上，絕藝的成長速度已經被外界注意到；而在 UEC上取得優異成果獲得更多關注後，絕藝及其背後的團隊依然神秘，為此我們對絕藝團隊進行了專訪，以期還原絕藝的成長路。　　從虎虎有生氣到“絕藝” 　　絕藝英文名FineArt，名出唐朝詩人杜牧的《重送絕句》——絕藝如君天下少，閒人似我世間無。別後竹窗風雪夜，一燈明暗覆吳圖。頗具中國風的名字，契合圍棋起源於中國的歷史。　　一年前，絕藝還只是一個存在於團隊頭腦中的想法。　　2016年1月28日，騰訊AI Lab高級總監、專家工程師劉永升在內部IM上收到一條來自騰訊副總裁姚星的消息：有沒有信心做圍棋AI，如果圍棋不行，先做象棋AI也行。　　姚星之所以萌生做圍棋AI的想法，源於他認為做這個對鍛煉團隊的研發能力有幫助，而且跟騰訊相關的應用前景很大。　　彼時劉永升對圍棋AI還沒有太清晰的概念，於是答覆姚星好好調研。在當年春節假期，劉永升找了一些圍棋的書籍、論文閱讀，對圍棋AI有了基本瞭解。春節回來後，2月17 日，姚星問圍棋AI有沒有在做，劉回答：還在調研，並承諾一個月後出DEMO。　　2016年3月4日，第一個DEMO完成，棋力在業餘5級左右，到3月下旬，圍棋AI正式立項，項目名稱weigo，團隊也隨之搭建起來。　　到2016年6月下旬，絕藝棋力突破業務6段，意即突破業餘高手水準，這是絕藝的一個重要發展節點。　　2016年8月，絕藝以“虎虎有生氣”的ID首次在野狐平臺（騰訊旗下圍棋對弈平臺）下棋，8月23日首次戰勝職業棋手，9月4日，絕藝以“野狐掃地僧”ID連贏 ID為tby的網友8局，tby是聶衛平長子孔令文的帳號。　　在不斷的學習中，絕藝的能力不斷增強。　　11月1日，絕藝正式以“絕藝”ID亮相野狐，11月2日第一次戰勝世界冠軍江維傑（野狐ID若水雲寒）。　　11月19日晚，“絕藝”首次和柯潔交手，一勝一負；11月28日，“絕藝”對韓國第一人樸廷桓5勝1負。2017年2月14日以後，絕藝對野狐帽子（世界冠軍和全國冠軍）的勝率，已經能夠穩定在90%以上。　　這個資料意味著，絕藝長大了。　　絕藝是這樣“煉成”的　　人工智慧究竟是如何學習怎樣下圍棋的？回顧絕藝從0到1的過程能夠得到解答。　　據絕藝團隊介紹，絕藝的學習方式包含兩部分，一部分來自人類棋譜，通過深度卷積網路的訓練，得到一個策略網路；第二部分為自對弈棋譜，也通過深度卷積網路訓練，得到一個估值網路。　　怎樣把人類的棋譜“喂”給絕藝，而絕藝又是如何理解人類棋譜的？首先絕藝團隊會把人類過往棋譜轉化為若干二維矩陣，作為深度卷積網路的輸入，輸出成果是一個策略網路。策略網路的作用在於，當你再輸入一個從來沒有存在過的新棋局時，策略網路可以返回若干候選點，並且為每個候選點計算相應的概率值。　　在絕藝的成長過程中，與人類棋手對弈是絕藝強大起來的重要原因，絕藝的突破性進展總是伴隨其戰勝某一實力水準的棋手出現。　　“我們在6月底戰勝業餘強豪，8月初首次戰勝職業初級選手，9月首次戰勝職業普通選手，11月首次戰勝職業高級選手。” 　　在11月份輸給煉心（時越）之後，絕藝閉關了一段時間，主要是大幅度提升了價值網路的精度，隨後以刑天的ID再次亮相。　　在絕藝團隊看來，與人類棋手對弈的意義在於，在研發過程中，如何評估棋力以及存在哪些問題是非常困難的，並且隨著絕藝棋力提升，普通的棋手基本無法戰勝的時候更難暴露其不足。所以，絕藝的研發過程中得益於世界超一流棋手的指導，非常難能可貴，對研發進度有非常大的説明。　　儘管身為絕藝的研發人員，在開發絕藝的過程中，團隊成員依然對AI的強大感到驚喜。　　“我們從來沒有想像AI可以這麼強，很多很複雜的棋，真不知道它為什麼可以正確應對，只能說深度神經網路真的很神奇。” 　　在不斷的學習中，絕藝的棋力已經成長到足夠讓一流棋手另眼相看的程度。2016年11 月19日晚上，絕藝和柯潔下了兩局，第一局絕藝第一次戰勝圍棋第一人柯潔，第二局惜敗。下完，柯潔發了一個朋友圈，內容是：“下的全是汗…\冷汗”。　　團隊愛把絕藝比作一個可愛的小孩。　　在3月17日絕藝與crazystone的對弈中，下到19手時，團隊成員看了絕藝的表現忍不住評價：絕藝又要動粗，要直接一本（柔道術語，意思是直接結束戰鬥）。　AI在圍棋上的成就已經得到普遍認可，但圍棋AI的存在並不意味著會成為人類棋手終結者。　　絕藝團隊認為，絕藝是帶動人類認識圍棋的新力量，它與其他AI不是競爭對手，而是共同推動人類對圍棋的認知。　　事實上，圍棋AI確實能給人類棋手帶來一些新角度的啟發。　　在一手打造了絕藝的團隊成員看來，經過多次人機對弈後，他們發現，人類棋手與圍棋AI各有特點：“人類比較狡猾，但人類容易犯錯；機器比較老實，但幾乎不犯錯。” 　　同時，絕藝的大局觀，以及對一些定式的變換是能夠給人類棋手不少啟發的。　　而開發圍棋AI的意義並不局限於圍棋領域。　　從團隊角度看來，研發絕藝促使團隊過去幾年在AI演算法研究、大規模計算平臺以及工程能力得到一次檢閱，並對深度學習和強化學習等AI熱門研究領域有了很多有價值的探索與創新。　　從技術角度看，絕藝背後的人工智慧技術是“精准決策”的能力，有非常廣闊的應用場景，如無人駕駛、量化金融、輔助醫療等。　　對絕藝團隊而言，絕藝當前取得的成果一方面完善了騰訊AI基礎設施，鍛煉了團隊，也大大提升了技術視野，強化了團隊的信心。另一方面，絕藝給了他們向更廣闊AI領域積極進軍的信心，隨著團隊對AI的研究不斷深入，AI在其他領域的更多可能將被逐漸挖掘。　　事實上，絕藝只是騰訊人工智慧戰略的一個體現。　　2016年4月，騰訊成立AI Lab（騰訊人工智慧實驗室），致力於人工智慧基礎科學的開放研究，以及應用領域的深入探索，做到“學術有影響，工業有產出”。　　實驗室的願景是打造騰訊全面AI競爭力，讓人工智慧未來無處不在（Make AI Everywhere）。　　目前實驗室有50余位世界知名學院的AI科學家（90%為博士）、及200多位經驗豐富的工程師進行基礎研究與應用探索。　　AI Lab聚焦四大領域的基礎研究，包括：電腦視覺、語音辨識、自然語言處理與機器學習，力求全面覆蓋並深層次拓展AI的前沿技術能力。同時發展AI在具有騰訊特色的四大業務場景中的應用能力：內容 AI、社交AI、遊戲AI和平臺工具AI。　　目前產品已應用在上百個騰訊產品上，在絕藝之後，騰訊於AI領域的佈局、研究和應用，已經進入加速時代。 http://sports.sina.com.cn/go/2017-03-19/doc-ifycnpiu9110991.shtml -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.114.161 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1489961321.A.7A1.html

推

ztdxqa

03/20 06:54, , 1^F

03/20 06:54, 1^F

推

sharge

03/20 07:54, , 2^F

03/20 07:54, 2^F

推

zeat

03/20 10:48, , 3^F

03/20 10:48, 3^F