[發案] 強化學習論文相關Implement
凡是「*[30m」開始的行,都請使用 Ctrl + y 刪除。
如果對於發案文章格式有不清楚的地方,請參考置底文章:[發案] 發案範例
發案人:astion
聯絡方式1:站內信詳談 謝謝
聯絡方式2:
所在地區 :網上
有效時間:徵到為止
專案說明:為基本強化學習論文Proximal Policy Optimization
的code Implement
gym的三種environment
Montaincar-v0
MontainCarContinou-v0
LunarLander-v2
預算:5000~10000可談
接案者要求:不對agent 做Curiosity的更改,不可直接import tf.agent.ppo
只能用tensorflow 2.x來Implement
附註:有提供寫好可以run但agent無法learning的source code
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 119.14.61.61 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/CodeJob/M.1616419863.A.123.html
※ 編輯: Astion (61.230.204.86 臺灣), 03/23/2021 14:53:25