作者查詢 / reinhert
作者 reinhert 在 PTT [ StarCraft ] 看板的留言(推文), 共44則
限定看板:StarCraft
看板排序:
全部C_Chat6658NSwitch3362PlayStation1575HatePolitics1176Gossiping483WOW412MiHoYo395IA393Baseball390GUNDAM213FORMULA1194Suckcomic191SRW117Evangelion110Nanoha110DiscoveryNGC46Kojima44StarCraft44MetalGear41GO40movie36Nintendo35Falcom34FinalFantasy34MobileComm28KenAkamatsu27politics25TypeMoon23CODE_GEASS19Marginalman19LightNovel17SWORD17Elephants16BraveSaga15Badminton14Gintama13Google12iOS12Tennis11C_and_CPP10DragonBall10NY-Yankees10GatoShoji9Olympics_ISG9BoardGame8Palmar_Drama8TW_Entertain8WorldCup8Shokugeki7TalesSeries7C_Question5MAC5PC_Shopping5AirForce4GAMEMUSIC4Guardians4Haruhi4Kaohsiung4Stock4Detective3Kindaichi_Q3Linux3Macross3NDS3PSP-PSV3SchoolRumble3Steam3SuperHeroes3Teacher3ArakawaCow2C_ChatBM2Chan_Mou2DummyHistory2FireEmblem2FuMouDiscuss2Mizuki_Nana2PCSH91_3052Physics2PublicIssue2Sub_GConsole2WomenTalk2Ace-Combat1AHSNCCU2-1261ARIA1basketballTW1BLEACH1ChainChron1CLAMP1ComGame-Plan1DeathNote1gallantry1GL1GUNNM1H-GAME1Hayate1HoneyClover1Hunter1IdolMaster1Japan_Travel1Jteam1KS95-3171LaTeX1Law-Fala1LittleNew1marriage1Military1Militarylife1Navy1NBA1NCCU_YAIC1NTNU-GSHIS1NTPU-DCSIE1NTUMSE-971NTUSTMIS_B911NTUT_IPET4951PttHistory1PuzzleDragon1Rockman1Seiya1seiyuu1single1StupidClown1TaichungBun1Tainan1Tech_Job1WarCraft1WarCraftChat1Warfare1<< 收起看板(128)
15F推: 慢走10/12 13:40
20F推: DeepMind敢拿出來代表已經有一定完成度,說不定早就在天01/23 13:48
21F→: 梯上測試過。之前AlphaGo也是確定能打才會直接挑李世石01/23 13:49
38F推: 上天梯是要測試成果,不是拿來訓練阿01/23 19:45
110F推: 其實和最初的版本已經好很多了,最初的版本連一般電腦都01/25 02:22
115F→: 打不過。01/25 02:23
134F→: 應該說已經展示出AlphaStar能判斷營運,控兵操作等在RL01/25 02:26
135F→: 中的Action判斷,代表DeepMind已經找出一個Reward方式去01/25 02:27
137F→: 判斷該作的Action了01/25 02:27
240F推: AlphaStar能和現役頂尖PK DeepMind早就抓出來了01/25 02:42
241F→: 有研究RL的一定對AlphaStar怎麼去做這些事非常好奇01/25 02:43
279F推: SC比起一般RL就是它的Action和環境複雜太多,而且Reward01/25 02:48
283F→: 很難訂,能打成這樣真的超有趣的01/25 02:48
516F→: 16TPU ?01/25 03:28
535F推: 他們應該都是直接TPU上了,GPU還嫌慢勒01/25 03:32
540F→: DNN到最後都是軍備競賽了啊,拼誰錢多砸硬體XD01/25 03:33
554F推: 他們有說用到GCP,所以應該是在上面跑,這NN的深度看來01/25 03:35
557F→: 不太可能在一般桌機上跑01/25 03:36
568F→: 演算法當然重要,但要是沒有足夠的硬體光訓練時間就先讓01/25 03:38
569F→: 實驗先GG了XD01/25 03:38
640F推: 最早記得是模擬滑鼠圈單位以及鍵盤下指令等動作,但不曉01/25 03:47
642F→: 得AS是不是也是這樣01/25 03:48
661F→: 我記得之前的論文是這樣說,很久沒看忘了,等這次論文出01/25 03:50
669F→: 來在研究,但DM最主要還是想模擬人類的操作動作,所以應01/25 03:51
670F→: 該不會直接使用API指定單位這樣的方式01/25 03:51
718F推: 不是教AS啊,是定好結構和函數等東西後丟下去自己學01/25 04:00
730F→: 幹嘛加失誤XD 又不是要完全模擬人類,不然再加個疲勞參01/25 04:01
731F→: 數好了XD01/25 04:02
765F推: 看來更長遠的戰略規劃AS還不行XD01/25 04:14
781F→: 現在的成就已經可以發了,表面上的整體操作已經很好了01/25 04:16
24F推: 好懷念tesl12/31 19:32
112F推: serral 4:0 sos11/03 22:18
18F推: serral根本大魔王10/20 19:21
76F推: has加油啊~09/08 20:39
263F推: 好好看的最後一場07/04 20:46
1F推: 當年測試過,單對單都差點被刺蛇打死12/06 09:16
109F推: 員警執勤過當昏頭了,從頭反到尾02/01 21:03
23F推:2:1 NADO贏05/23 20:57