PTT
網頁版
登入/註冊
新聞
熱門文章
熱門看板
看板列表
作者查詢
最新文章
我的收藏
最近瀏覽
看板名稱查詢
批踢踢 PTT 搜尋引擎
看板
[
NTUEE_LAB206
]
討論串
[研究] DHP?
共 4 篇文章
排序:
最新先
|
最舊先
|
留言數
|
推文總分
內容預覽:
開啟
|
關閉
|
只限未讀
首頁
上一頁
1
下一頁
尾頁
#4
Re: [研究] DHP?
推噓
0
(0推
0噓 0→
)
留言
0則,0人
參與
,
最新
作者
neumann
(€ΝΕμΜΑΝΝ€)
時間
13年前
發表
(2012/10/31 19:58)
,
編輯
資訊
0篇文章回應此文
0
內文有0個圖片
image
0
內文有0個連結
link
0
內容預覽:
事實證明. 那篇論文造假. 害我白忙近兩年的研究時光. 我一年多前早就看出來了. --.
※
發信站:
批踢踢實業坊(ptt.cc)
. ◆ From: 140.112.25.205.
#3
Re: [研究] DHP?
推噓
0
(0推
0噓 0→
)
留言
0則,0人
參與
,
最新
作者
neumann
(€ΝΕμΜΑΝΝ€)
時間
15年前
發表
(2011/01/04 13:00)
,
編輯
資訊
0篇文章回應此文
0
內文有0個圖片
image
0
內文有0個連結
link
0
內容預覽:
昨天想來想去用PSO調DHP也只有調critic這個方法. 不過 shadow critic的目標值還是需要系統模型的微分 @@.... 除非是 HDP .... 不過聽說HDP收斂性很爛.... --.
※
發信站:
批踢踢實業坊(ptt.cc)
. ◆ From: 140.112.25.205.
#2
Re: [研究] DHP?
推噓
0
(0推
0噓 0→
)
留言
0則,0人
參與
,
最新
作者
YOSHIK1
(a.testoni)
時間
15年前
發表
(2011/01/04 10:57)
,
編輯
資訊
0篇文章回應此文
0
內文有0個圖片
image
0
內文有0個連結
link
0
內容預覽:
我猜老師的意思應該是critic 跟 actor 都保留. 但是調整critic network不用系統模型微分,而是用PSO調. 再用調完的critic調actor. --.
※
發信站:
批踢踢實業坊(ptt.cc)
. ◆ From: 114.45.177.24.
#1
[研究] DHP?
推噓
0
(0推
0噓 0→
)
留言
0則,0人
參與
,
最新
作者
neumann
(€ΝΕμΜΑΝΝ€)
時間
15年前
發表
(2011/01/04 01:16)
,
編輯
資訊
0篇文章回應此文
0
內文有0個圖片
image
0
內文有0個連結
link
0
內容預覽:
今天花了點時間研究 DHP. 研究他的network的weight如何update. 結果就是用back-propagation更新actor的weight 才會用到 critic的訊號(HDP也是). 那這樣我用PSO調weight不就不用critic了!. 那這樣就不是DHP了啊..... 看到
首頁
上一頁
1
下一頁
尾頁