Re: [閒聊] AI打星海爭霸,後來如何?
: 這時候AlphaStar有一大票追獵者,看起來非常兇悍。
: 但 Mana 只要用稜鏡把部隊運到對方家裡騷擾,AlphaStar的大軍就會班師回朝
: 戰鬥上 AlphaStar 只有「大部隊集結抗衡敵人」的概念
: 同時,AlphaStar 策略上也不太屌兵種對抗優劣,從頭至尾貫徹「追獵者最棒!」
: 這個大家在猜是因為AlphaStar覺得這兵種在消耗上最有效率
: 然後面對 Mana 的 不朽+破壞能 大軍,AlphaStar一樣用追獵者上去對幹。
: 想當然爾當然是輸了 從人類的角度看起來這兵種對抗要贏實在太難了
我覺得這部分當然應該是訓練給的APM相關參數有問題
也就是說給AI的APM上限還是太高,導致AI可以靠操作硬幹
我個人的推測是AI對局那個兩百年數據量,不太可能沒有用到不朽
那如果數據裡面有不朽結果還是敢用追獵硬推,而且確實也給他推成功了
那簡單來說就是這種微操無敵的兵種對AI來說太強
強到一般人類理解的優劣跟AI對局時的優劣是不同的
其實個人覺得星海一部分的問題在這裡
有沒有微操的情況下兵種強度存在差異
微操算是職業選手的基本功
雖然AI做出來的微操有點太離譜,但其實在一般人眼中選手的微操也很離譜
而重點是-不同微操能力下兵種克制的狀態也不同
就像一般人而言被毒爆衝生化會被換的很傷
但對選手而言,傷不傷取決於你散兵的能力
因此同理,對AI而言
如果部隊交戰時的微操對對局的影響大於你運營、策略、兵種克制的影響
那AI就會傾向於在部隊交戰時微操最大化
那就會回歸上面那個前提-APM設定太高導致兵種克制的概念與人類不同
某程度確實算是訓練失敗,因為前提與人類有明顯差距
但可以5:0可能代表在AI那個APM之下,閃追幹正面是局部最佳解
就跟人類以前找出來的三不朽等局部最佳解類似
: 當然你可以說結果就是 4:1 ,AlphaStar屌虐。
: 但我同時也相信那個時間點找其他人類高手跟AlphaStar打,
: AlphaStar的贏面應該是很低。因為策略認知上的缺陷被Mana暴露出來了
我是覺得AI的策略有時候是這樣
AI的局部最佳解不一定跟人類的局部最佳解一樣
而星海這個遊戲的微操會大幅影響遊戲的特質
讓AI只要在操作上設定的不夠貼近人類,那他得到的答案就會跟人類差距很大
以前圍棋沒有所謂的微操問題
具體來說只有每一步有多少思考時間的差別
但星海爭霸這款微操會影響策略的遊戲
這次AI讓人不服氣的點是交戰時APM過高導致兵種克制與我們認知的差距太大
但其實AI下棋的時候也有類似的狀況
很多職業棋手看到AI的下法都會困惑,更會直接建議初學者不要學AI的下法
因為AI的策略不會告訴你他的邏輯是什麼
所以直接說AI的策略有問題可能只是人類的一廂情願
因為可能在AI的領域中,那個策略問題都是可以解決的
也因此回到前面的部分,你要為AI設下多少限制才「公平」
這次是閃追獵的操作上限太高,職業選手也做不到這個上限
所以變成騎摩托車跑一百公尺那種感覺
但是AI的自我對局中,大家(自己跟自己的分身)都是騎摩托車的
所以策略都是基於騎摩托車來發展
不過似乎這計畫沒有要繼續做下去
所以也很難看到AI再壓低APM之後的策略轉變了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.64.25.104 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1661853349.A.467.html
推
08/30 17:58,
1年前
, 1F
08/30 17:58, 1F
→
08/30 17:59,
1年前
, 2F
08/30 17:59, 2F
推
08/30 18:00,
1年前
, 3F
08/30 18:00, 3F
→
08/30 18:00,
1年前
, 4F
08/30 18:00, 4F
推
08/30 18:01,
1年前
, 5F
08/30 18:01, 5F
→
08/30 18:01,
1年前
, 6F
08/30 18:01, 6F
推
08/30 18:01,
1年前
, 7F
08/30 18:01, 7F
→
08/30 18:01,
1年前
, 8F
08/30 18:01, 8F
推
08/30 18:02,
1年前
, 9F
08/30 18:02, 9F
→
08/30 18:02,
1年前
, 10F
08/30 18:02, 10F
→
08/30 18:02,
1年前
, 11F
08/30 18:02, 11F
→
08/30 18:02,
1年前
, 12F
08/30 18:02, 12F
→
08/30 18:03,
1年前
, 13F
08/30 18:03, 13F
推
08/30 18:03,
1年前
, 14F
08/30 18:03, 14F
→
08/30 18:03,
1年前
, 15F
08/30 18:03, 15F
→
08/30 18:03,
1年前
, 16F
08/30 18:03, 16F
→
08/30 18:04,
1年前
, 17F
08/30 18:04, 17F
→
08/30 18:05,
1年前
, 18F
08/30 18:05, 18F
→
08/30 18:05,
1年前
, 19F
08/30 18:05, 19F
→
08/30 18:05,
1年前
, 20F
08/30 18:05, 20F
→
08/30 18:05,
1年前
, 21F
08/30 18:05, 21F
推
08/30 18:05,
1年前
, 22F
08/30 18:05, 22F
→
08/30 18:05,
1年前
, 23F
08/30 18:05, 23F
推
08/30 18:07,
1年前
, 24F
08/30 18:07, 24F
→
08/30 18:07,
1年前
, 25F
08/30 18:07, 25F
推
08/30 18:08,
1年前
, 26F
08/30 18:08, 26F
→
08/30 18:08,
1年前
, 27F
08/30 18:08, 27F
→
08/30 18:08,
1年前
, 28F
08/30 18:08, 28F
推
08/30 18:08,
1年前
, 29F
08/30 18:08, 29F
推
08/30 18:09,
1年前
, 30F
08/30 18:09, 30F
→
08/30 18:10,
1年前
, 31F
08/30 18:10, 31F
推
08/30 18:10,
1年前
, 32F
08/30 18:10, 32F
→
08/30 18:10,
1年前
, 33F
08/30 18:10, 33F
→
08/30 18:10,
1年前
, 34F
08/30 18:10, 34F
推
08/30 18:11,
1年前
, 35F
08/30 18:11, 35F
→
08/30 18:12,
1年前
, 36F
08/30 18:12, 36F
→
08/30 18:12,
1年前
, 37F
08/30 18:12, 37F
→
08/30 18:13,
1年前
, 38F
08/30 18:13, 38F
→
08/30 18:15,
1年前
, 39F
08/30 18:15, 39F
→
08/30 18:15,
1年前
, 40F
08/30 18:15, 40F
→
08/30 18:15,
1年前
, 41F
08/30 18:15, 41F
→
08/30 18:15,
1年前
, 42F
08/30 18:15, 42F
→
08/30 18:15,
1年前
, 43F
08/30 18:15, 43F
→
08/30 18:16,
1年前
, 44F
08/30 18:16, 44F
→
08/30 18:16,
1年前
, 45F
08/30 18:16, 45F
推
08/30 18:18,
1年前
, 46F
08/30 18:18, 46F
→
08/30 18:18,
1年前
, 47F
08/30 18:18, 47F
根據我的認知,這種AI並沒有很明確的邏輯跟因果
而是把每一場訓練出來的參數透過神經元疊層等複雜的計算方式給予不同的權重
是比較類似人類大腦運作方式的AI
因為不是靠邏輯推演,給他更多資訊他只會告訴你我的訓練的資料不是長這樣
所以直接把戰爭迷霧解除對AI而言可能只會讓她困惑「這種場面我沒看過」
然後為什麼我說AI的局部最佳解會因為APM設定過寬鬆而跟人類顯著不同
原因是這種AI是左右互搏在訓練的
如果你設定的微操速度過高,那AI就會基於那個微操速度來左右互搏
因此在人類看起來很傻眼的閃追獵,在AI對局裡面應該是基本戰術
然後這個戰術強無敵導致AI只要速爬閃追獵就能吃掉所有對局
所以進一步的讓AI寧可冒不偵查的風險也要賺那一點資源來抵達這個「終點」
類似的狀況還有AI跟人對局,工兵數一樣但AI的資源生產效率就是快1成
這多半也是AI為了盡快抵達特定戰略目標而產生的「產資源微操」
※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 18:30:22
推
08/30 18:21,
1年前
, 48F
08/30 18:21, 48F
→
08/30 18:21,
1年前
, 49F
08/30 18:21, 49F
→
08/30 18:21,
1年前
, 50F
08/30 18:21, 50F
推
08/30 18:28,
1年前
, 51F
08/30 18:28, 51F
→
08/30 18:28,
1年前
, 52F
08/30 18:28, 52F
→
08/30 18:32,
1年前
, 53F
08/30 18:32, 53F
→
08/30 18:32,
1年前
, 54F
08/30 18:32, 54F
推
08/30 18:35,
1年前
, 55F
08/30 18:35, 55F
→
08/30 18:36,
1年前
, 56F
08/30 18:36, 56F
推
08/30 18:40,
1年前
, 57F
08/30 18:40, 57F
→
08/30 18:40,
1年前
, 58F
08/30 18:40, 58F
→
08/30 18:42,
1年前
, 59F
08/30 18:42, 59F
→
08/30 18:42,
1年前
, 60F
08/30 18:42, 60F
→
08/30 18:42,
1年前
, 61F
08/30 18:42, 61F
推
08/30 18:44,
1年前
, 62F
08/30 18:44, 62F
沒限制的意義就是悍馬內戰誰最強
這也是說這個計畫不是那麼成功的原因
我知道了閃追強無敵,但這不是我想知道的
我有找到一些其他的AS對戰影片,等我看完再來告訴大家一些結論
※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 18:47:08
推
08/30 18:55,
1年前
, 63F
08/30 18:55, 63F
→
08/30 18:55,
1年前
, 64F
08/30 18:55, 64F
→
08/30 18:55,
1年前
, 65F
08/30 18:55, 65F
→
08/30 18:55,
1年前
, 66F
08/30 18:55, 66F
推
08/30 19:32,
1年前
, 67F
08/30 19:32, 67F
→
08/30 19:32,
1年前
, 68F
08/30 19:32, 68F
→
08/30 19:33,
1年前
, 69F
08/30 19:33, 69F
推
08/30 19:46,
1年前
, 70F
08/30 19:46, 70F
→
08/30 19:46,
1年前
, 71F
08/30 19:46, 71F
→
08/30 19:46,
1年前
, 72F
08/30 19:46, 72F
→
08/30 19:46,
1年前
, 73F
08/30 19:46, 73F
→
08/30 20:01,
1年前
, 74F
08/30 20:01, 74F
→
08/30 20:02,
1年前
, 75F
08/30 20:02, 75F
→
08/30 20:03,
1年前
, 76F
08/30 20:03, 76F
人類方出的奇招在AI方算不算奇招其實要打個問號
因為如果微操強無敵的話,照理來說完美操作的大招應該也很強
但從AI應對先知騷擾等手段來看,
其實人類認知的大招在AI眼中幾乎是可以用操作來處理的
※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 20:05:33
推
08/30 20:09,
1年前
, 77F
08/30 20:09, 77F
→
08/30 20:09,
1年前
, 78F
08/30 20:09, 78F
推
08/30 20:12,
1年前
, 79F
08/30 20:12, 79F
→
08/30 20:12,
1年前
, 80F
08/30 20:12, 80F
討論串 (同標題文章)