Re: [新聞] 人類對決 AI!《星海爭霸》選手首次挑戰已回收

看板C_Chat作者 (人,原來不是人)時間6年前 (2017/10/26 00:44), 編輯推噓11(12158)
留言71則, 10人參與, 7年前最新討論串3/3 (看更多)
: 推 win4104: 現在阿法狗團隊的瓶頸是 沒辦法把戰局優劣勢簡單實時的 10/25 15:23 : → win4104: 量化 10/25 15:23 不太懂為什麼沒辦法量化,去比較低、中、高階的記錄檔就可以發現一些很主要的差異 例如:資源量、有效操作量、資源交換比 為什麼 RTS 絕大部分提高遊戲 AI 難度都是靠著給 AI 更多資源? 一大主因就是資源量很重要,當你的資源比對手少時,你只能靠著提高資源交換比 來扳回資源差距,影響資源交換比的要素太多就先不討論,但若只是需要指標的話 ,資源交換比絕對是需要列出來比較的 資源交換比就是你用了多少資源換掉對手多少資源,例如你不損一隻就全殲對手全部 軍事單位,這次交戰的資源交換比就是對手生產軍事單位所花掉的資源,去除以你用 來殲滅對手軍事單位所花掉的資源 有效操作量對電腦來說可能比較沒影響,因為電腦不會像人類一樣玩到後期很容易腦 袋空空,下出一些很沒意義的指令,不過有效操作量在哪個時間點該花在哪方面則是 需要深入研究 另一個很重要的是時間點,這邊用快攻來說明比較方便,假設一邊採取快攻,另一邊 採取爬科技,若快攻方在那邊一直屯兵,想說屯到數量夠了才進攻,結果夠了的時候 對方已經爬完科技,導致快攻方被高科技的兵屠殺 越早把資源用來生產軍事單位,越要確保你的資源交換比夠大,大到可以消耗或抵銷 對手先把資源用來拼經濟或科技所帶來的優勢;對手方則是反過來,盡可能地減少快 攻方的資源交換比 雖然比的還是資源交換比,但進攻時間點的選擇則是取決於你的戰術 從另一個角度來看,就是你花在軍事單位上的資源到開始有資源交換比的閒置時間有 多長,通常時間越長越不好,不過由於星海不封路的場次很少見,所以這數據未必能 用來當量化指標 通常資源量、資源交換比都贏對手的情況下,都是勝利的一方 -- 「看在上帝的份上,我們不能當著孩子的面槍殺他的父親!」 「那我們就連孩子一起幹掉!」 「第一槍打中的是那個天真的孩子,第二槍是抱著孩子的母親。第三槍 停頓了三秒,當難以致信的父親擦拭著臉上愛子的腦漿從震驚中醒轉 過來,慢慢的轉頭看向停車的地方,分辨出是誰在攻擊他後,第三顆 子彈才將他的腦殼打飛。」 ─摘自〈狼群〉 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.167.137 ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1508949875.A.FD7.html

10/26 00:55, 6年前 , 1F
要評價的是 這個營運流程能不能得到更高的資源量
10/26 00:55, 1F

10/26 00:55, 6年前 , 2F
這個操作是不是有效操作
10/26 00:55, 2F

10/26 00:55, 6年前 , 3F
這樣的戰術選擇與配兵能不能得到更多的交換比
10/26 00:55, 3F

10/26 00:55, 6年前 , 4F
五分鐘內是這樣 十分鐘後是嗎? 十五分鐘後是嗎?
10/26 00:55, 4F

10/26 00:55, 6年前 , 5F
那AI在蓋了一棟很貴的建築後就會投降了 因為資源見底
10/26 00:55, 5F

10/26 00:56, 6年前 , 6F
同樣的操作在不同的情境下評價會不同
10/26 00:56, 6F

10/26 00:56, 6年前 , 7F
而那個評價的依據還可能是來自還在戰場迷霧中的資訊
10/26 00:56, 7F

10/26 00:57, 6年前 , 8F
以深度學習的做法來看,需要給的只有指標,剩下的靠訓練過程
10/26 00:57, 8F

10/26 00:58, 6年前 , 9F
這邊說的資源量是累積的總量,不是目前手上擁有的資源
10/26 00:58, 9F

10/26 00:58, 6年前 , 10F
Rts 沒有那麽單純 一隻兵站在某個點上 從不同的角度解釋
10/26 00:58, 10F

10/26 00:58, 6年前 , 11F
可能是優 可能是劣
10/26 00:58, 11F

10/26 00:59, 6年前 , 12F
局勢大體會跟資源 交換比這些成正相關 但這不是絕對
10/26 00:59, 12F

10/26 01:00, 6年前 , 13F
你有可能存了200的資源跟部隊 但是因為沒反隱形被一隊隱
10/26 01:00, 13F

10/26 01:00, 6年前 , 14F
刀 隱形女妖滅國
10/26 01:00, 14F

10/26 01:00, 6年前 , 15F
目前 AI 需要的就是單純化的指標,不需要去考慮到太細
10/26 01:00, 15F

10/26 01:01, 6年前 , 16F
或是照理來講應該能完勝的部隊在推進時被少量機動部隊換
10/26 01:01, 16F

10/26 01:01, 6年前 , 17F
10/26 01:01, 17F

10/26 01:01, 6年前 , 18F
數字依據終究只能作為參考 沒辦法當作評價局勢的重要依據
10/26 01:01, 18F

10/26 01:02, 6年前 , 19F
建築物也是需要花掉資源,所以少量機動部隊抄家就是達成高的
10/26 01:02, 19F

10/26 01:02, 6年前 , 20F
資源交換比
10/26 01:02, 20F

10/26 01:02, 6年前 , 21F
如果只用這些單純的數字當指標 我相信AI會被多變的戰術耍
10/26 01:02, 21F

10/26 01:02, 6年前 , 22F
的團團轉
10/26 01:02, 22F

10/26 01:03, 6年前 , 23F
所以你要怎麼評價這個行動能不能得到更高的交換比
10/26 01:03, 23F

10/26 01:04, 6年前 , 24F
對方可能在正面 可能不是 如果是 我推進能打贏 如果不是
10/26 01:04, 24F

10/26 01:04, 6年前 , 25F
我推進有可能被換家
10/26 01:04, 25F

10/26 01:04, 6年前 , 26F
那推進這個選項的評價是什麼
10/26 01:04, 26F

10/26 01:05, 6年前 , 27F
靠深度學習的演算法,在經過大量訓練之後,電腦能找出最佳參
10/26 01:05, 27F

10/26 01:05, 6年前 , 28F
數,以實現資源量、資源交換比的最大化
10/26 01:05, 28F

10/26 01:06, 6年前 , 29F
那個簡單指標怎麼定義就是我說的問題所在
10/26 01:06, 29F

10/26 01:06, 6年前 , 30F
Deepmind嘗試過讓AI以遊戲分數作為指標 結果AI從頭到尾只
10/26 01:06, 30F

10/26 01:06, 6年前 , 31F
會採礦
10/26 01:06, 31F

10/26 01:09, 6年前 , 32F
最難的就是怎樣去定義出最好的指標呀..
10/26 01:09, 32F

10/26 01:10, 6年前 , 33F
即時戰略會影響勝負的指標比圍棋多太多了
10/26 01:10, 33F

10/26 01:13, 6年前 , 34F
呵呵
10/26 01:13, 34F

10/26 01:17, 6年前 , 35F
如果你知道資源量、資源交換比跟勝率有正相關,為什麼不想以
10/26 01:17, 35F

10/26 01:17, 6年前 , 36F
這兩個為簡單指標呢?
10/26 01:17, 36F

10/26 01:18, 6年前 , 37F
你是用局勢跟那兩者有關
10/26 01:18, 37F

10/26 01:33, 6年前 , 38F
資源交換比跟勝率有正相關這也是必須參考其他情境分析
10/26 01:33, 38F

10/26 01:33, 6年前 , 39F
不適用於所有情境
10/26 01:33, 39F

10/26 01:50, 6年前 , 40F
有正相關不代表相關性就夠高..
10/26 01:50, 40F

10/26 06:03, 6年前 , 41F
所以簡單指標必須適用於所有情境? 這是找指標的前提嗎?
10/26 06:03, 41F

10/26 07:17, 6年前 , 42F
10/26 07:17, 42F

10/26 09:24, 6年前 , 43F
如果你的指標代表性不夠 那就不是個好的指標
10/26 09:24, 43F

10/26 09:25, 6年前 , 44F
目標是要贏 如果達成指標卻沒能提高勝率 那要這個指標何
10/26 09:25, 44F

10/26 09:25, 6年前 , 45F
10/26 09:25, 45F

10/26 10:11, 6年前 , 46F
圍棋一樣沒辦法知道每一步的優劣啊,AGZ是用蒙地卡羅搜尋
10/26 10:11, 46F

10/26 10:11, 6年前 , 47F
不同落子點的勝率來做訓練的
10/26 10:11, 47F

10/26 10:46, 6年前 , 48F

10/26 10:47, 6年前 , 49F
已經不是了
10/26 10:47, 49F

10/26 11:42, 6年前 , 50F
關於推文提到的一些問題,其實總歸就是把人類行為規則
10/26 11:42, 50F

10/26 11:42, 6年前 , 51F
找出來而已,目前各類自動化工程都類似這個狀況,所以
10/26 11:42, 51F

10/26 11:43, 6年前 , 52F
近年AI突破一個階段就是神經學有所發展導致的,知道
10/26 11:43, 52F

10/26 11:43, 6年前 , 53F
規則怎麼跑,AI最簡單的其中一項目標就是複製人類行為
10/26 11:43, 53F

10/26 11:44, 6年前 , 54F
所以有些問題不是問題
10/26 11:44, 54F

10/26 12:36, 6年前 , 55F
什麼時候已經證明資源量、資源交換比這兩個指標無法提高勝率
10/26 12:36, 55F

10/26 12:40, 6年前 , 56F
同樣一個問題反過來問你呢?
10/26 12:40, 56F

10/26 12:40, 6年前 , 57F
如果這些指標這麼有效 Deepmind會沒想到?
10/26 12:40, 57F

10/26 12:41, 6年前 , 58F
會出現只會飛基地追求和局 跟只採礦追求分數這兩種狀況?
10/26 12:41, 58F

10/26 12:41, 6年前 , 59F
這兩個是Deepmind目前研究已經發生的狀況
10/26 12:41, 59F

10/26 12:50, 6年前 , 60F
出現的那兩種狀況有註明說是用了哪些指標?
10/26 12:50, 60F

10/26 12:51, 6年前 , 61F
我是不知道他們有沒有想到那兩個指標,因為他們沒說
10/26 12:51, 61F

10/26 12:51, 6年前 , 62F
所以我不會當成他們已經想過了
10/26 12:51, 62F

10/26 12:57, 6年前 , 63F
第一個是勝利 第二個是星海本身的遊戲積分機制
10/26 12:57, 63F

10/26 12:59, 6年前 , 64F
再問個問題 是優勢造成交換比上升 還是交換比上升造成優
10/26 12:59, 64F

10/26 12:59, 6年前 , 65F
勢? 根本的原因是什麼 還是看到的只是結果
10/26 12:59, 65F

10/26 13:02, 6年前 , 66F
資源 有效操作EPM 跟戰損比 都是星海系統自己已經算好給
10/26 13:02, 66F

10/26 13:02, 6年前 , 67F
你的數字
10/26 13:02, 67F

10/26 13:02, 6年前 , 68F
連自己另外算都不用
10/26 13:02, 68F

10/26 13:02, 6年前 , 69F
我不覺的他們會沒試過
10/26 13:02, 69F

10/26 14:11, 6年前 , 70F
居然有人認為坐在ptt前想到的東西 專業研究人員沒想過
10/26 14:11, 70F

01/05 15:59, 7年前 , 71F
這不就Ptt日常啊 以為自己超會
01/05 15:59, 71F
文章代碼(AID): #1PyBzp_N (C_Chat)
討論串 (同標題文章)
文章代碼(AID): #1PyBzp_N (C_Chat)