[外絮] 騰訊最新AI在SC2上擊敗作弊電腦

看板StarCraft作者 (andy920262)時間5年前 (2018/09/26 14:23), 5年前編輯推噓24(24026)
留言50則, 23人參與, 5年前最新討論串1/1
原始論文: https://arxiv.org/pdf/1809.07193v1.pdf 我本身是SC2玩家也對AI稍有研究,最近剛好看到這篇上禮拜才發表的論文,台灣似乎還沒什麼新聞或討論。 這篇應該是目前第一篇“公開”研究聲稱可以“進行整場遊戲並擊敗玩家”的論文,先前SC2的研究都是只能進行小遊戲的程度。 簡單來講,騰訊發表了2個不同的AI稱為TStarBot1跟TStarBot2在深海礁岩這張地圖進行ZvZ遊戲,APM限制在400-800。 TStarBot1是跟電腦對局了700萬場自我學習的,TStartBot2則是沒有經過學習直接被人類給予規則的AI(Rule-base AI)。 這兩隻AI對上作弊電腦分別取得80%跟90%的勝率,並成功擊敗白金~鑽石段位的玩家(不過場次很少)。 不過論文中有提到,TStarBot1在玩了700萬場後學到勝率最高的招式是異化蟲快攻,因此對上真實玩家多打幾場就會被破解。 而TStarBot2使用的戰術就比較多元,但以AI研究的角度來看,Rule-base AI就只是根據人類賦予的知識進行遊戲,並沒有辦法自行學習更強的戰術,因此現在的AI研究多半是自我學習為重點。 技術細節的部分我就不提了,有興趣了解的可以推文我盡量解答￿。 重點就是現在SC2 AI的研究還只能打打電腦,先前天梯高端有AI出沒的傳言多半是假的,不然就是除了騰訊外有其他尚未公開的研究在測試,雖然個人認為機率不高就是了。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.97.96 ※ 文章網址: https://www.ptt.cc/bbs/StarCraft/M.1537942999.A.CBF.html

09/26 14:45, 5年前 , 1F
之前在API發表之後,Deepmind玩SC2似乎都還沒有消息?
09/26 14:45, 1F

09/26 14:45, 5年前 , 2F
700萬場只會12d???
09/26 14:45, 2F

09/26 14:48, 5年前 , 3F
700萬場的Z學會了一個12D...
09/26 14:48, 3F

09/26 14:48, 5年前 , 4F
而且是ZvZ...
09/26 14:48, 4F

09/26 14:51, 5年前 , 5F
應該不是只學會12D 而是12D效率最佳 XD
09/26 14:51, 5F

09/26 14:51, 5年前 , 6F
學T的時候 大概也是每一場2BB
09/26 14:51, 6F

09/26 15:00, 5年前 , 7F
沒有讀檔案內文,但如果是照AlphaGO的模式,一開始應該
09/26 15:00, 7F

09/26 15:00, 5年前 , 8F
是從AI連規則都不清楚就讓他自己摸索?
09/26 15:00, 8F
AlphaGo是先模仿人類之後才自我學習,一般來講這種學法比較有效,但SC2要取得大量可學習的replay比較困難,看文章應該是重頭學沒錯

09/26 15:10, 5年前 , 9F
deepmind的不是還在人族建築起飛戰術?
09/26 15:10, 9F

09/26 15:13, 5年前 , 10F
2bb 12D 野bg 應該都是最高的 博弈心態再加上操作
09/26 15:13, 10F

09/26 15:16, 5年前 , 11F
400~800APM也太高了 200~400才合理吧
09/26 15:16, 11F

09/26 15:18, 5年前 , 12F
看了下內容 他直接做了165個Macro 換句話說他已經先綁好
09/26 15:18, 12F

09/26 15:18, 5年前 , 13F
AI會做什麼子動作了...
09/26 15:18, 13F

09/26 15:19, 5年前 , 14F
不能說偷雞拉 因為確實這些動作是可以先設定好的
09/26 15:19, 14F

09/26 15:19, 5年前 , 15F
但是就不是從0開始
09/26 15:19, 15F

09/26 15:22, 5年前 , 16F
我覺得一開始有些Marco應該還算合理,如果一出世就有
09/26 15:22, 16F

09/26 15:22, 5年前 , 17F
個Rule Base而且沒綁腳本感覺有點太可怕。不過很看好
09/26 15:22, 17F

09/26 15:22, 5年前 , 18F
他的前景,期許有天可以改善遊戲內建的AI,甚至有機會
09/26 15:22, 18F

09/26 15:22, 5年前 , 19F
指導玩家哪些細節需要改善
09/26 15:22, 19F

09/26 15:23, 5年前 , 20F
發現筆誤,不是說Rule Base而是只有純輸入Rule
09/26 15:23, 20F

09/26 15:40, 5年前 , 21F
強化獎勵的部份最難
09/26 15:40, 21F

09/26 16:00, 5年前 , 22F
AIp要是碾壓另外兩族ai算不算是pimba(被拉走
09/26 16:00, 22F

09/26 16:20, 5年前 , 23F
謝謝你告訴我12D轉大龍
09/26 16:20, 23F

09/26 16:59, 5年前 , 24F
能打贏作弊難度的電腦很厲害欸
09/26 16:59, 24F

09/26 17:00, 5年前 , 25F
以為看到吃肉人族 先打電腦
09/26 17:00, 25F
※ 編輯: andy920262 (114.136.97.96), 09/26/2018 17:37:19

09/26 17:36, 5年前 , 26F
12D勝感覺...很靠賽
09/26 17:36, 26F

09/26 19:16, 5年前 , 27F
感覺ai條件比新人還差,新人還能上網找攻略,AI看攻
09/26 19:16, 27F

09/26 19:16, 5年前 , 28F
略的話就被說作弊了。
09/26 19:16, 28F

09/26 19:33, 5年前 , 29F
因為目標不一樣啊XD
09/26 19:33, 29F

09/26 20:02, 5年前 , 30F
我只是想說這樣還打的贏很厲害,我看了攻略都沒能打
09/26 20:02, 30F

09/26 20:02, 5年前 , 31F
09/26 20:02, 31F

09/26 21:28, 5年前 , 32F
其實從來就沒有規定AI不能參考這個參考那個
09/26 21:28, 32F

09/26 21:28, 5年前 , 33F
只是那隻狗Re:0的威能太大 所有人都會想拿來比一下
09/26 21:28, 33F

09/26 21:30, 5年前 , 34F
期待像圍棋一樣能探索出一個全新的世界
09/26 21:30, 34F

09/26 21:51, 5年前 , 35F
二樓好好笑
09/26 21:51, 35F

09/26 23:30, 5年前 , 36F
我APM只有100不到
09/26 23:30, 36F

09/26 23:33, 5年前 , 37F
星海的變化比圍棋複雜太多 要training很久才有可能適
09/26 23:33, 37F

09/26 23:33, 5年前 , 38F
應各種情況吧
09/26 23:33, 38F

09/27 03:54, 5年前 , 39F
看了一下,Bot1只是給了165個"基本概念"比如甚麼是挖礦
09/27 03:54, 39F

09/27 03:55, 5年前 , 40F
攻擊的時候要點選目標、甚麼是科技之類的
09/27 03:55, 40F

09/27 03:56, 5年前 , 41F
deepmind則是故意甚麼都不教?
09/27 03:56, 41F

09/27 03:58, 5年前 , 42F
只是APM設計得有點太高了,職業選手也很難一直這樣
09/27 03:58, 42F

09/27 03:59, 5年前 , 43F
更何況,學習戰術、操作一定程度之後,理論上Bot不會有
09/27 03:59, 43F

09/27 03:59, 5年前 , 44F
操作失誤吧
09/27 03:59, 44F

09/27 08:25, 5年前 , 45F
Deepmind是故意什麼都不教 Bot1是先設定好了一點結構
09/27 08:25, 45F

09/27 08:26, 5年前 , 46F
不是不可以拉 但是要詳細看到寫得多死
09/27 08:26, 46F

09/28 15:38, 5年前 , 47F
我還以為最強是ai是甩毒爆的槍兵
09/28 15:38, 47F

09/28 15:39, 5年前 , 48F
而且rouge曾經出現2000apm過 限制不為過吧
09/28 15:39, 48F

09/28 15:43, 5年前 , 49F
那我用加速鍵盤丟蛋瞬間APM破萬也算嗎...
09/28 15:43, 49F

09/28 21:58, 5年前 , 50F
2000APM是產單位吧
09/28 21:58, 50F
文章代碼(AID): #1RgoNNo_ (StarCraft)