[分析] gradient descent

看板Math作者WalterbyJeff (Be the field)時間6年前 (2017/10/16 16:50)推噓4(4推 0噓 15→)

留言19則, 6人參與討論串1/1

在gradient descent 的基本理論裡面給定初始值 (eg: x=0) 的cost function J(x) (先簡化成單一變數) 經由 x_k+1= x_k - α*dJ(x)/dx // α:learning factor 可以逼近出來 x= x* (收斂點) 所以這個 dJ(x_k)/dx 變成保證能最快收斂的factor 但是我如何證明,不是其他函數(e.g. dJ(x_k)/dx + h(x) ) ？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.74.122.97 ※ 文章網址: https://www.ptt.cc/bbs/Math/M.1508143828.A.1C0.html

→

10/16 16:54, 6年前 , 1^F

10/16 16:54, 1^F

→

10/16 21:07, 6年前 , 2^F

10/16 21:07, 2^F

推

10/16 21:42, 6年前 , 3^F

10/16 21:42, 3^F

→

10/16 22:18, 6年前 , 4^F

10/16 22:18, 4^F

→

10/16 22:25, 6年前 , 5^F

10/16 22:25, 5^F

推

10/17 15:56, 6年前 , 6^F

10/17 15:56, 6^F

這局部最快的原因有什麼定理名稱嗎？我知道很簡單,大概是分析的初階內容,但是我現在想看一下,當作查用的. ※ 編輯: WalterbyJeff (203.74.122.97), 10/17/2017 17:27:11

推

10/17 22:50, 6年前 , 7^F

10/17 22:50, 7^F

→

10/17 22:51, 6年前 , 8^F

10/17 22:51, 8^F

→

10/17 22:52, 6年前 , 9^F

10/17 22:52, 9^F

→

10/17 22:54, 6年前 , 10^F

10/17 22:54, 10^F

→

10/17 22:55, 6年前 , 11^F

10/17 22:55, 11^F

→

10/17 22:57, 6年前 , 12^F

10/17 22:57, 12^F

→

10/17 22:59, 6年前 , 13^F

10/17 22:59, 13^F

→

10/17 23:00, 6年前 , 14^F

10/17 23:00, 14^F

→

10/17 23:00, 6年前 , 15^F

10/17 23:00, 15^F

推

10/17 23:03, 6年前 , 16^F

10/17 23:03, 16^F

→

10/17 23:03, 6年前 , 17^F

10/17 23:03, 17^F

→

10/17 23:04, 6年前 , 18^F

10/17 23:04, 18^F

→

10/18 18:03, 6年前 , 19^F

10/18 18:03, 19^F

‣ 返回看板[ Math ] 數學

‣ 更多 WalterbyJeff 的文章

文章代碼(AID): #1Pv7BK70 (Math)