作者查詢 / AmibaGelos

總覽項目：發文 | 留言 | 暱稱

作者 AmibaGelos 在 PTT [ GO ] 看板的留言(推文), 共40則

限定看板：GO

尾頁

[ GO ]68 留言, 推噓總分: +9

作者: kafai - 發表於 2016/03/14 13:17(8年前)

1^F推AmibaGelos: 推!實際上去估一下cNN讀取時間就會發現分析深度超級淺03/14 13:22

2^F→AmibaGelos: MCTS後段才是處理手筋的重點所在03/14 13:25

[ GO ]53 留言, 推噓總分: +10

作者: fallcolor - 發表於 2016/03/12 11:35(8年前)

25^F→AmibaGelos: policy不能用RL,因為RL會有破台後便固定玩法的問題03/12 12:02

29^F→AmibaGelos: 或著說他會很容易掉到local minimal上,比較合理的還是03/12 12:03

33^F→AmibaGelos: 用SL或是和SL對練的RL03/12 12:03

34^F→AmibaGelos: 然後這篇跟我的經驗完全相反@@..起碼在online的時候03/12 12:09

35^F→AmibaGelos: data的entropy越高NN表現就越比PM+regression好03/12 12:10

41^F→AmibaGelos: 用時估算,fast policy等關鍵點google肯定是不會講的03/12 12:32

42^F→AmibaGelos: 大家講的神乎其技的DCNN反而是最簡單的部分@@03/12 12:33

49^F→AmibaGelos: 只要比RN好OTZ,從RL Value到SL policy就從6d升到8d了03/12 13:00

尾頁