Re: [閒聊] AI打星海爭霸,後來如何?

看板C_Chat作者 (petohtalrayn)時間1年前 (2022/08/30 17:55), 1年前編輯推噓24(24056)
留言80則, 19人參與, 1年前最新討論串4/7 (看更多)
: 大家可以看 2:10:16 開始的部分 https://youtu.be/cUTMhmVh1qs?t=7816
: 這時候AlphaStar有一大票追獵者,看起來非常兇悍。 : 但 Mana 只要用稜鏡把部隊運到對方家裡騷擾,AlphaStar的大軍就會班師回朝 : 戰鬥上 AlphaStar 只有「大部隊集結抗衡敵人」的概念 : 同時,AlphaStar 策略上也不太屌兵種對抗優劣,從頭至尾貫徹「追獵者最棒!」 : 這個大家在猜是因為AlphaStar覺得這兵種在消耗上最有效率 : 然後面對 Mana 的 不朽+破壞能 大軍,AlphaStar一樣用追獵者上去對幹。 : 想當然爾當然是輸了 從人類的角度看起來這兵種對抗要贏實在太難了 我覺得這部分當然應該是訓練給的APM相關參數有問題 也就是說給AI的APM上限還是太高,導致AI可以靠操作硬幹 我個人的推測是AI對局那個兩百年數據量,不太可能沒有用到不朽 那如果數據裡面有不朽結果還是敢用追獵硬推,而且確實也給他推成功了 那簡單來說就是這種微操無敵的兵種對AI來說太強 強到一般人類理解的優劣跟AI對局時的優劣是不同的 其實個人覺得星海一部分的問題在這裡 有沒有微操的情況下兵種強度存在差異 微操算是職業選手的基本功 雖然AI做出來的微操有點太離譜,但其實在一般人眼中選手的微操也很離譜 而重點是-不同微操能力下兵種克制的狀態也不同 就像一般人而言被毒爆衝生化會被換的很傷 但對選手而言,傷不傷取決於你散兵的能力 因此同理,對AI而言 如果部隊交戰時的微操對對局的影響大於你運營、策略、兵種克制的影響 那AI就會傾向於在部隊交戰時微操最大化 那就會回歸上面那個前提-APM設定太高導致兵種克制的概念與人類不同 某程度確實算是訓練失敗,因為前提與人類有明顯差距 但可以5:0可能代表在AI那個APM之下,閃追幹正面是局部最佳解 就跟人類以前找出來的三不朽等局部最佳解類似 : 當然你可以說結果就是 4:1 ,AlphaStar屌虐。 : 但我同時也相信那個時間點找其他人類高手跟AlphaStar打, : AlphaStar的贏面應該是很低。因為策略認知上的缺陷被Mana暴露出來了 我是覺得AI的策略有時候是這樣 AI的局部最佳解不一定跟人類的局部最佳解一樣 而星海這個遊戲的微操會大幅影響遊戲的特質 讓AI只要在操作上設定的不夠貼近人類,那他得到的答案就會跟人類差距很大 以前圍棋沒有所謂的微操問題 具體來說只有每一步有多少思考時間的差別 但星海爭霸這款微操會影響策略的遊戲 這次AI讓人不服氣的點是交戰時APM過高導致兵種克制與我們認知的差距太大 但其實AI下棋的時候也有類似的狀況 很多職業棋手看到AI的下法都會困惑,更會直接建議初學者不要學AI的下法 因為AI的策略不會告訴你他的邏輯是什麼 所以直接說AI的策略有問題可能只是人類的一廂情願 因為可能在AI的領域中,那個策略問題都是可以解決的 也因此回到前面的部分,你要為AI設下多少限制才「公平」 這次是閃追獵的操作上限太高,職業選手也做不到這個上限 所以變成騎摩托車跑一百公尺那種感覺 但是AI的自我對局中,大家(自己跟自己的分身)都是騎摩托車的 所以策略都是基於騎摩托車來發展 不過似乎這計畫沒有要繼續做下去 所以也很難看到AI再壓低APM之後的策略轉變了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.64.25.104 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1661853349.A.467.html

08/30 17:58, 1年前 , 1F
手速太高基本上不是跟AI打,是跟外掛打
08/30 17:58, 1F

08/30 17:59, 1年前 , 2F
那個人類也做不到的操作基本上就是不公平的存在
08/30 17:59, 2F

08/30 18:00, 1年前 , 3F
是說AI是不是情蒐都做得很到位? 大招有用嗎XD 雖然我想
08/30 18:00, 3F

08/30 18:00, 1年前 , 4F
大招成功幾次後 AI懂得怎麼防了就沒用了
08/30 18:00, 4F

08/30 18:01, 1年前 , 5F
情蒐也是要犧牲單位去巡邏才有 AI有養成嗎?
08/30 18:01, 5F

08/30 18:01, 1年前 , 6F
不管有沒有情蒐都閃追幹死你的話 也沒必要情蒐了
08/30 18:01, 6F

08/30 18:01, 1年前 , 7F
@lsd25968 你講的這種思考方式是人類的思考方式
08/30 18:01, 7F

08/30 18:01, 1年前 , 8F
早期搞人的手段 微操好可以解決七八成吧
08/30 18:01, 8F

08/30 18:02, 1年前 , 9F
問題是高手速前提下大招可能都不是大招,我記得之前
08/30 18:02, 9F

08/30 18:02, 1年前 , 10F
AI被先知搞結果損失都是微乎其微
08/30 18:02, 10F

08/30 18:02, 1年前 , 11F
另外關於APM的部分,我沒有相關證據,但我自己認為APM
08/30 18:02, 11F

08/30 18:02, 1年前 , 12F
會設定成我們看到的那種高度很可能是因為如果不這樣設定
08/30 18:02, 12F

08/30 18:03, 1年前 , 13F
AlphaStar可能沒辦法訓練到能拿出來DEMO的程度
08/30 18:03, 13F

08/30 18:03, 1年前 , 14F
同意在ai的apm下 會有和人類玩家不同的meta
08/30 18:03, 14F

08/30 18:03, 1年前 , 15F
至少我覺得沒啥道理他如果 APM 150就能打贏人類他會需要
08/30 18:03, 15F

08/30 18:03, 1年前 , 16F
給到 300 APM
08/30 18:03, 16F

08/30 18:04, 1年前 , 17F
畢竟這項實驗,APM設定越低 結果的價值就越高
08/30 18:04, 17F

08/30 18:05, 1年前 , 18F
這也是RTS對遊戲公司而言為難的地方 最早期人族打針高階玩
08/30 18:05, 18F

08/30 18:05, 1年前 , 19F
家無敵中低階就是被滾爛燒爛 沒有一個平衡性是能高低階環
08/30 18:05, 19F

08/30 18:05, 1年前 , 20F
境兼顧的
08/30 18:05, 20F

08/30 18:05, 1年前 , 21F
畢竟實驗結果是跟你說AI和人的apm操作結果不同了
08/30 18:05, 21F

08/30 18:05, 1年前 , 22F
選手的微操不會在一般人眼中離譜啊 做不到而已 ai那個叫肉
08/30 18:05, 22F

08/30 18:05, 1年前 , 23F
眼看就知道人類做不到
08/30 18:05, 23F

08/30 18:07, 1年前 , 24F
不不選手的操作看起來也一點都不像人類啊 每個都像有四隻
08/30 18:07, 24F

08/30 18:07, 1年前 , 25F
手 屏幕一秒刷一次的
08/30 18:07, 25F

08/30 18:08, 1年前 , 26F
取消戰爭迷霧,AI還會選擇爆單一兵種嗎?
08/30 18:08, 26F

08/30 18:08, 1年前 , 27F
而且像parting也有打過完全無損閃追操作贏下一局 那也是很
08/30 18:08, 27F

08/30 18:08, 1年前 , 28F
非人類
08/30 18:08, 28F

08/30 18:08, 1年前 , 29F
取消戰爭迷霧那玩的就不是星海爭霸了
08/30 18:08, 29F

08/30 18:09, 1年前 , 30F
其實這也牽扯到遊戲本身平衡的方向了 兵種的操作性本來
08/30 18:09, 30F

08/30 18:10, 1年前 , 31F
就在平衡的考量中
08/30 18:10, 31F

08/30 18:10, 1年前 , 32F
先讓他學習
08/30 18:10, 32F

08/30 18:10, 1年前 , 33F
本來想看策略 結果AI覺得微操就夠了
08/30 18:10, 33F

08/30 18:10, 1年前 , 34F
兵種相剋,再開啟戰爭迷霧讓它擬定策略
08/30 18:10, 34F

08/30 18:11, 1年前 , 35F
問題是這其實不是這種AI的訓練方式
08/30 18:11, 35F

08/30 18:12, 1年前 , 36F
是啊 你不能想像他是個人類XD
08/30 18:12, 36F

08/30 18:12, 1年前 , 37F
當初會選星海來訓練就是因為不像圍棋,星海有迷霧吧
08/30 18:12, 37F

08/30 18:13, 1年前 , 38F
我聽到的也是想嘗試看看RL下AI在非全知遊戲下的表現
08/30 18:13, 38F

08/30 18:15, 1年前 , 39F
不然回去比非即時呢
08/30 18:15, 39F

08/30 18:15, 1年前 , 40F
回到職業選手 先不管地圖快捷 一般大後期為了閃AOE和方便
08/30 18:15, 40F

08/30 18:15, 1年前 , 41F
施法 加上要顧後方 控制群組至少要6、7個時時緊盯 這你覺
08/30 18:15, 41F

08/30 18:15, 1年前 , 42F
得是人類幹得出來的事?
08/30 18:15, 42F

08/30 18:15, 1年前 , 43F
結果AI:戰爭迷霧?閃現追獵能解決一切問題
08/30 18:15, 43F

08/30 18:16, 1年前 , 44F
非即時到alphago養好就已經不用再比啦
08/30 18:16, 44F

08/30 18:16, 1年前 , 45F
按鍵太多 手就開始跟不上腦袋了 AI可沒這個問題
08/30 18:16, 45F

08/30 18:18, 1年前 , 46F
另外,策略認知有無問題是結果論。不是說AI在模擬環境
08/30 18:18, 46F

08/30 18:18, 1年前 , 47F
覺得這是最佳解那就正確
08/30 18:18, 47F
根據我的認知,這種AI並沒有很明確的邏輯跟因果 而是把每一場訓練出來的參數透過神經元疊層等複雜的計算方式給予不同的權重 是比較類似人類大腦運作方式的AI 因為不是靠邏輯推演,給他更多資訊他只會告訴你我的訓練的資料不是長這樣 所以直接把戰爭迷霧解除對AI而言可能只會讓她困惑「這種場面我沒看過」 然後為什麼我說AI的局部最佳解會因為APM設定過寬鬆而跟人類顯著不同 原因是這種AI是左右互搏在訓練的 如果你設定的微操速度過高,那AI就會基於那個微操速度來左右互搏 因此在人類看起來很傻眼的閃追獵,在AI對局裡面應該是基本戰術 然後這個戰術強無敵導致AI只要速爬閃追獵就能吃掉所有對局 所以進一步的讓AI寧可冒不偵查的風險也要賺那一點資源來抵達這個「終點」 類似的狀況還有AI跟人對局,工兵數一樣但AI的資源生產效率就是快1成 這多半也是AI為了盡快抵達特定戰略目標而產生的「產資源微操」 ※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 18:30:22

08/30 18:21, 1年前 , 48F
職業選手恐怖就在那些按鍵腦袋和手都能處理 而且是非公式
08/30 18:21, 48F

08/30 18:21, 1年前 , 49F
化的應對 至少在serral碾壓的時候是這麼一回事 歐美的大後
08/30 18:21, 49F

08/30 18:21, 1年前 , 50F
期靈活打法更勝韓國的公式化打法
08/30 18:21, 50F

08/30 18:28, 1年前 , 51F
Serral明明是個完美呈現公式化應對到極致的玩家XD 所以他最
08/30 18:28, 51F

08/30 18:28, 1年前 , 52F
不會打ZVZ這種主動的對抗
08/30 18:28, 52F

08/30 18:32, 1年前 , 53F
要說準備戰術不得不提bo無敵的男人rogue
08/30 18:32, 53F

08/30 18:32, 1年前 , 54F
看他打zvz根本藝術
08/30 18:32, 54F

08/30 18:35, 1年前 , 55F
就AI發現剪刀石頭布裡面石頭其實是手榴彈
08/30 18:35, 55F

08/30 18:36, 1年前 , 56F
他學怎麼丟手榴彈就好 管他剪刀跟布
08/30 18:36, 56F

08/30 18:40, 1年前 , 57F
之前有 沒限制的 影片
08/30 18:40, 57F

08/30 18:40, 1年前 , 58F
ai的可以 把部隊散開 閃aoe 太扯
08/30 18:40, 58F

08/30 18:42, 1年前 , 59F
AlphaStar有限制,但看來限制太寬鬆
08/30 18:42, 59F

08/30 18:42, 1年前 , 60F
導致AS得到的結果就是閃追OP
08/30 18:42, 60F

08/30 18:42, 1年前 , 61F
然後鳳凰強無敵
08/30 18:42, 61F

08/30 18:44, 1年前 , 62F
沒限制不就跟悍馬一樣,有意義嗎
08/30 18:44, 62F
沒限制的意義就是悍馬內戰誰最強 這也是說這個計畫不是那麼成功的原因 我知道了閃追強無敵,但這不是我想知道的 我有找到一些其他的AS對戰影片,等我看完再來告訴大家一些結論 ※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 18:47:08

08/30 18:55, 1年前 , 63F
事實上你指的 人類不知道AI這麼做的原因是什麼<—這點
08/30 18:55, 63F

08/30 18:55, 1年前 , 64F
這幾年一直是研究的方向之一 以圍棋舉例好了 現在的AI
08/30 18:55, 64F

08/30 18:55, 1年前 , 65F
已經能告訴你出這步棋他為什麼這麼下 好是好在哪裡 甚
08/30 18:55, 65F

08/30 18:55, 1年前 , 66F
至人類下一手也能分析出勝率跟優劣
08/30 18:55, 66F

08/30 19:32, 1年前 , 67F
看勝率本來就可以了吧,能夠自解釋倒是聞所未聞,哪
08/30 19:32, 67F

08/30 19:32, 1年前 , 68F
家的圍棋ai?
08/30 19:32, 68F

08/30 19:33, 1年前 , 69F
要解釋這一手好在哪,是什麼解釋法?
08/30 19:33, 69F

08/30 19:46, 1年前 , 70F
ai自練,可能因為總是在找最佳化策略(而非針對所有策
08/30 19:46, 70F

08/30 19:46, 1年前 , 71F
略的應對模式),最終的答案就是閃追互打,打了幾千萬
08/30 19:46, 71F

08/30 19:46, 1年前 , 72F
局之後就只是一直優化這個策略,人類出奇招(甚至只是
08/30 19:46, 72F

08/30 19:46, 1年前 , 73F
很普通的偷家)就會讓ai整個錯愕然後失常
08/30 19:46, 73F

08/30 20:01, 1年前 , 74F
其實奇招是有考慮的
08/30 20:01, 74F

08/30 20:02, 1年前 , 75F
而且結論就是,你就算奇招還是打不贏我閃追(遠目)
08/30 20:02, 75F

08/30 20:03, 1年前 , 76F
至少這五場閃追都是強到超乎人類所知的策略
08/30 20:03, 76F
人類方出的奇招在AI方算不算奇招其實要打個問號 因為如果微操強無敵的話,照理來說完美操作的大招應該也很強 但從AI應對先知騷擾等手段來看, 其實人類認知的大招在AI眼中幾乎是可以用操作來處理的 ※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 20:05:33

08/30 20:09, 1年前 , 77F
阿法星當初去打天梯也被養壞,被三族各路大招快攻搞到只
08/30 20:09, 77F

08/30 20:09, 1年前 , 78F
會大召
08/30 20:09, 78F

08/30 20:12, 1年前 , 79F
然後韓國的星海風和歐洲完全不同,想搞出kespa鼎盛期韓
08/30 20:12, 79F

08/30 20:12, 1年前 , 80F
國的大將級選手機乎不可能
08/30 20:12, 80F
文章代碼(AID): #1Z3TwbHd (C_Chat)
討論串 (同標題文章)
文章代碼(AID): #1Z3TwbHd (C_Chat)