Re: [新聞] 人工智能開始玩星海爭霸 2,它玩的如何?
論文:https://deepmind.com/documents/110/sc2le.pdf
如果AI以點擊為輸入介面的話,星海每個動作估計有10^8個可能性,相較之下,19路圍棋
每步棋最多只有19x19種可能性。
戰爭迷霧有特殊的圖形介面讓AI知道戰爭迷霧在哪裡(見論文圖2)。
APM設定成180,換算一下就是AI一秒最多只能下三道指令。
關於學習的部分,首先DM讓AI自己跟自己左右互搏,一場最多打30分鐘,超時算平手,學
到最後和內建最簡單的電腦1v1測試,AI一場也沒贏過,只有平手或輸掉兩種結果(見論文
圖5)。
之後DM讓AI去看800K個replay,這800K個replay從最低端到職業玩家都有,AI從這些
replay學習局面判斷能力。遊戲剛開始的時候,因為輸贏機率一樣,所以AI預測準確率為
50%。遊戲進行到愈後面AI準確率愈高,在遊戲時間15分鐘的時候AI有65%機率猜對最後結
果(見論文圖8)。
然後DM讓AI模仿replay裡面玩家的行為,論文最後只提到AI會去生產一些軍事單位(見論
文圖9),沒提到能不能打贏最簡單的電腦......
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.177.51
※ 文章網址: https://www.ptt.cc/bbs/StarCraft/M.1502639935.A.11C.html
推
08/14 00:05, , 1F
08/14 00:05, 1F
推
08/14 00:20, , 2F
08/14 00:20, 2F
→
08/14 00:20, , 3F
08/14 00:20, 3F
推
08/14 00:23, , 4F
08/14 00:23, 4F
推
08/14 00:24, , 5F
08/14 00:24, 5F
推
08/14 00:51, , 6F
08/14 00:51, 6F
→
08/14 00:52, , 7F
08/14 00:52, 7F
→
08/14 00:52, , 8F
08/14 00:52, 8F
→
08/14 01:01, , 9F
08/14 01:01, 9F
→
08/14 01:07, , 10F
08/14 01:07, 10F
→
08/14 02:51, , 11F
08/14 02:51, 11F
推
08/14 03:03, , 12F
08/14 03:03, 12F
推
08/14 10:29, , 13F
08/14 10:29, 13F
推
08/14 11:00, , 14F
08/14 11:00, 14F
→
08/14 11:44, , 15F
08/14 11:44, 15F
※ kira925:轉錄至看板 C_Chat 08/14 11:49
推
08/14 13:41, , 16F
08/14 13:41, 16F
→
08/14 13:42, , 17F
08/14 13:42, 17F
→
08/14 13:43, , 18F
08/14 13:43, 18F
討論串 (同標題文章)
完整討論串 (本文為第 4 之 4 篇):