[問題] 電腦決策(下棋 打怪等)

看板Statistics作者 (SaltLake)時間6年前 (2017/11/24 16:02), 6年前編輯推噓5(502)
留言7則, 4人參與, 7年前最新討論串1/1
電腦下棋的決策所涉及的數學模式是什麼? 或者說聯繫每一步棋落子的位置之決定和棋盤現有的 敵我棋子分布的數學模型是什麼? 最直觀的是窮舉法 把蒐集得到的各個棋譜的每一步 變化都存到資料庫 下棋的時候在一一比對 但是這樣很花時間不說 萬一出現資料庫存以外的 棋局狀態怎麼辦? 有甚麼書在介紹這方面的嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.208.34 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1511510521.A.6CE.html

11/24 17:46, 6年前 , 1F
markov decicion process可能會是一種
11/24 17:46, 1F

11/24 22:11, 6年前 , 2F
很多論文 電機系的朋友有做過類似的
11/24 22:11, 2F
論文名稱或關鍵字能提供嗎? ※ 編輯: saltlake (220.136.208.34), 11/24/2017 23:09:22

11/26 06:03, 6年前 , 3F
蒙地卡羅還有reinforcement learning
11/26 06:03, 3F

11/26 06:08, 6年前 , 4F
當然還有最火熱的deep learning
11/26 06:08, 4F

11/26 06:10, 6年前 , 5F
基本上是不會用窮舉法的,而是用大量的棋譜訓練來獲得模
11/26 06:10, 5F

11/26 06:10, 6年前 , 6F
11/26 06:10, 6F

01/08 10:25, 7年前 , 7F
RL + MCTS
01/08 10:25, 7F
文章代碼(AID): #1Q5z7vRE (Statistics)