Re: [問題] 星海爭霸AI比賽的遊戲訊息輸入方式?

看板StarCraft作者 (Taiwanese)時間7年前 (2017/05/23 17:27), 編輯推噓13(13032)
留言45則, 13人參與, 最新討論串2/3 (看更多)
※ 引述《dharma (達)》之銘言: : 有人說可能是架設攝影機來觀看螢幕畫面 : 機械手臂操控鍵鼠(限制手速) : 讓AI能以最接近人類的方式來競賽 : 也有人說是遊戲內容會轉換成給AI軟體讀取的資訊 : 類似下面影片這樣 : https://www.youtube.com/watch?v=5iZlrBqDYPM
: 請問比賽方式有定案了嗎 : thanks 剛好這個禮拜又迎來了AlphaGo對柯潔的對局。不過目前Deepmind對星海這部分透露的還不 多,只能聊一些對未來可能作法的猜測了。 就像很多板友在推文裡談到的,人類與AI的對決會有很多技術性問題。例如要如何讓AI認 識每個單位、地形、資源,這也是原po連結中我們目前唯一可以瞥見的相關技術釋出。其 他的還有常常在爭議的輸入方式,包括APM等等。不過我認為對Deepmind來說,最重要的問 題還是「如何建立一個成功的決策系統」,而不會是悍馬2000這種對比於人類幾乎無限APM 的操作方式。 圍棋的資訊對兩方玩家都是完全公開的。玩家們都是靠著當下局面的同樣訊息進行決策。 而在攻克圍棋這個項目後,會來嘗試星海我想也是不讓人那麼意外的。圍棋和星海同樣是 現成的遊戲,所以它們的規則清楚、目標明確;而兩個遊戲在決策上最大的不同處則可能 在於資訊的透明程度。 從設計圍棋的決策系統來看,AlphaGo必須要能評估每個局面下的利益,這樣才能知道自己 下的這步棋是不是「好」的。對比到星海,我們可以常常想到小色和91這些「專業解說」 在下判斷時也常常會有「雖然吃掉這波兵,但是經濟落後太多」、「目前局勢對他不利, 就看他能用領先的科技打到什麼東西」,這類的「價值判斷」。而價值判斷正確與否的最 終判準在於遊戲最後是不是贏了。所以像是如何拿捏經濟、科技、兵力這種資源分配的決 策就是AI需要去學習的。另外,還有兵種如何搭配,例如人類機械化雖然正面強,但如果 被對方拖住戰線,自己的後方就很容易受到騷擾而又機動力不足,無法即時回撤。又比如 有時候「沒回頭路了,只能換家」、「這時候再不推出去就沒機會了」之類的戰機把握也 是相當重要的決策。 比起圍棋,因為規則的不同而使得星海的決策種類變得非常不同。而最該死的,更是這些 決策時常是建立在資訊的不完整上。「要如何運用手上已有的資訊來預測對方可能作出的 決策,並作出合理的決策來進行應對」,這話說起來很饒口,用例子可能比較清楚,最單 純的可能是看蟲族的農民數、有無開氣來猜測對方是慢狗開、快狗開、搶經濟等的戰略。 比較神乎其神的是像教主開圖那樣,覺得事情不對勁,抓到對方野兵營。比如很久以前看 到一場大雨神的比賽,對方野隱刀,但是大雨神(對我來說)莫名其妙的在沒偵查到隱刀塔 的情況下用三水晶把自己的家門封住。這樣的決策絕對是有理由的,其他板友的解釋是說 由於在偵察對方基地時看到對方早開氣,但又一直沒看到耗氣的兵種,所以下了對方野隱 刀這樣的判斷。 這使得如何、何時更新手上的資訊本身就變成重要的決策之一。例如幾分鐘灑雷達?幾分 鍾看到什麼代表什麼意思?前期的毒暴蟲巢是一波;中期的反而是為了防守。什麼時候又 要二次偵查?確定自己的情報不是被對方作表情誤導的? 這樣說起來,在星海中要做出一個成功的決策系統實在是滿高的挑戰。目前AlphaGo的勝率 也許可以挑戰九成以上了,雖然目前樣本不多,但從最舊的版本到目前最新的版本,人類 能贏的只有李世石那唯一的一盤。可以說在圍棋規則的決策環境中,AI已經可以代替人類 作出更好的決定了。跟星海比較起來,我想比較不同之處在於星海的資訊不透明上,另一 點則是決策時間更短,需要運算得更快。如何調配資源、配兵、出兵這類的決策我想對AI 來說不算太難,有足夠的時間應該就能建立起來。比較難的還是如何在有限的資訊量下持 續作出更好的決策,同時還得克服比起圍棋更加動態的局面。 APM等等問題,在人類對決中是重中之重,決定何方高手更能執行自己的決策。但我想對於 Deepmind來說,更重要的是透過遊戲這種「規則明確」、「價值判斷明確」的特性來學習 如何建立一個成功的決策系統。再不斷挑戰各種限制和複雜程度的環境之後,才更有機會 面對人類社會中的其他決策,畢竟生活之中有許多問題的決策比起遊戲更加複雜,或者曖 昧不明...... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.242.139.173 ※ 文章網址: https://www.ptt.cc/bbs/StarCraft/M.1495531668.A.A38.html

05/23 18:02, , 1F
推一個,google絕對不是想做個「打星海會贏人類的AI
05/23 18:02, 1F

05/23 18:02, , 2F
」,而是希望透過這個遊戲能讓AI接近人類的思考決策
05/23 18:02, 2F

05/23 18:06, , 3F
如果是純AI對戰 早就在sc1辦超過10年啦 之前twitch還天天
05/23 18:06, 3F

05/23 18:08, , 4F
播 也用不到deepmind 無人車其實已經能解決基本的像素畫
05/23 18:08, 4F

05/23 18:09, , 5F
面判斷跟偽道德兩難問題
05/23 18:09, 5F

05/23 18:12, , 6F
推樓上,視覺辨識挺難的,但是技術已逐漸克服這個問題。
05/23 18:12, 6F

05/23 18:13, , 7F
重點是AI不用做到完美 只要比人類好個一兩倍就夠了 看看
05/23 18:13, 7F

05/23 18:14, , 8F
路上的3寶決策 用數學演算法超過他們似乎不是很困難 XDDD
05/23 18:14, 8F

05/23 18:18, , 9F
樓上那可未必,演算法發現違規效率>>>守法時 絕對比三寶還
05/23 18:18, 9F

05/23 18:18, , 10F
05/23 18:18, 10F

05/23 18:25, , 11F
很精闢 拭目以待
05/23 18:25, 11F

05/23 19:16, , 12F
05/23 19:16, 12F

05/23 20:22, , 13F
印象中deepmind是自己去學怎麼玩 SC AI靠人寫好的程式跑
05/23 20:22, 13F

05/23 20:58, , 14F
05/23 20:58, 14F

05/23 20:58, , 15F
裡面舉的例子很寫實,也代表現在無人車AI其實還很不成熟
05/23 20:58, 15F

05/24 13:23, , 16F
之前看到一個文章 深度學習機的神經網路層數越高反
05/24 13:23, 16F

05/24 13:23, , 17F
而錯誤率比少一點點層數還高 但星海比圍棋複雜太多
05/24 13:23, 17F

05/24 13:23, , 18F
是不是能用多組深度學習系統配合演算 例如一個負責
05/24 13:23, 18F

05/24 13:23, , 19F
會戰 一個負責營運 每個最佳解整合出一個勝率最高
05/24 13:23, 19F

05/24 13:23, , 20F
的決策? 那這樣的話剩下就是演算法跟效能需要突破
05/24 13:23, 20F

05/24 13:23, , 21F
的問題因為星海是即時制效能太重要了
05/24 13:23, 21F

05/24 13:35, , 22F
決策從微觀的操作(拉哪隻兵集火誰)到營運資源分配到大局觀
05/24 13:35, 22F

05/24 13:35, , 23F
不行 因為APM是有限資源
05/24 13:35, 23F

05/24 13:36, , 24F
要思考/運算的東西其實超級多 很期待看看deepmind怎麼學
05/24 13:36, 24F

05/24 13:36, , 25F
APM是無限資源的話掛幾個AI都可以 但有限資源就要有分配
05/24 13:36, 25F

05/24 13:37, , 26F
APM當然要有限 因為現實世界就是有限資源下做思考
05/24 13:37, 26F

05/24 13:46, , 27F
阿,我是回aadd 不是teren
05/24 13:46, 27F

05/24 13:47, , 28F
在可使用的操作有限下 那個分配的AI對其他區域解會有嚴重
05/24 13:47, 28F

05/24 13:47, , 29F
的干擾 譬如會戰的AI會想要操作每一隻追獵/槍兵 可是APM
05/24 13:47, 29F

05/24 13:48, , 30F
有限&與營運需要的視野轉換有衝突 那怎麼分?
05/24 13:48, 30F

05/24 14:09, , 31F
K大:我知道會限制APM但是思考判斷應該不會限制 所
05/24 14:09, 31F

05/24 14:09, , 32F
以我在想應該會有一個優先順序 畫面切會戰當然主要
05/24 14:09, 32F

05/24 14:09, , 33F
操作在控兵 但是快捷鍵也能做一點營運跟補兵沒錯吧
05/24 14:09, 33F

05/24 14:09, , 34F
就是優先順序的問題
05/24 14:09, 34F

05/24 14:12, , 35F
而且就是限制操作所以電腦應該會更偏向人類真實操作
05/24 14:12, 35F

05/24 14:12, , 36F
而不會想去控每一隻兵反而沒效率
05/24 14:12, 36F

05/24 23:15, , 37F
不太同意接近人類思考那段。打贏人類的思考才是根本吧
05/24 23:15, 37F

05/24 23:16, , 38F
然後所謂AI並不是微操+倍的那種層面好嗎=_=
05/24 23:16, 38F

05/24 23:25, , 39F
給奈奈ByuN的操作 跟阿法狗對局第一招就是3BB跳死神或槍兵
05/24 23:25, 39F

05/24 23:25, , 40F
阿法狗要贏也只能乖乖靠操作了
05/24 23:25, 40F

05/25 04:49, , 41F
推myhole大。從AlphaGo看起來,AI的學習和決策方式跟人
05/25 04:49, 41F

05/25 04:49, , 42F
類不太一樣。
05/25 04:49, 42F

05/27 03:49, , 43F
電腦比較大的優勢應該是分兵防守 能準確分兵
05/27 03:49, 43F

05/27 03:49, , 44F
感覺對電腦來說 多線應該不能達到拉扯陣型的效果
05/27 03:49, 44F

05/27 03:50, , 45F
可以想像的是電腦正面會非常猛 畢竟基本功能達到完美
05/27 03:50, 45F
文章代碼(AID): #1P902Keu (StarCraft)
討論串 (同標題文章)
文章代碼(AID): #1P902Keu (StarCraft)