作者查詢 / AmibaGelos
作者 AmibaGelos 在 PTT [ GO ] 看板的留言(推文), 共40則
限定看板:GO
看板排序:
全部PC_Shopping832NBA277NTU-Fantasy191Mathematica155movie153CFantasy103Physics72NTUcourse61NTU_TS57nb-shopping47Gossiping42GO40DataScience20TSHS12nCoV20196DC5Beauty4DSLR4graduate4joke4Math4TOEFL_iBT4phys003C_Chat2Spurs2Agronomy-971B961010XX1B96A013XX1B97A011XX1B98A012XX1B991010XX1BBSmovie1BLAZERS1Cavaliers1civil961HatePolitics1Key_Mou_Pad1LifeSci_961NTU1NTU-Exam1NTU08DFLL1NTUAC961ntuACCT001NTUBA011NTUCE-1001NTUDrama981NTUEE1111NTUfin001NTUIM-191NTUIM-201NTUMEB971NTUmed961NTUmed971NTUmed981NTUmed991NTUMSE-971NTUMT-971NTUPPM-971PH-961PH-991PHX-Suns1phys981Psychology021PT-961Raptors1Stock1VET_991Windows1WomenTalk1<< 收起看板(69)
1F推: 推!實際上去估一下cNN讀取時間就會發現分析深度超級淺03/14 13:22
2F→: MCTS後段才是處理手筋的重點所在03/14 13:25
25F→: policy不能用RL,因為RL會有破台後便固定玩法的問題03/12 12:02
29F→: 或著說他會很容易掉到local minimal上,比較合理的還是03/12 12:03
33F→: 用SL或是和SL對練的RL03/12 12:03
34F→: 然後這篇跟我的經驗完全相反@@..起碼在online的時候03/12 12:09
35F→: data的entropy越高NN表現就越比PM+regression好03/12 12:10
41F→: 用時估算,fast policy等關鍵點google肯定是不會講的03/12 12:32
42F→: 大家講的神乎其技的DCNN反而是最簡單的部分@@03/12 12:33
49F→: 只要比RN好OTZ,從RL Value到SL policy就從6d升到8d了03/12 13:00