[線代] 向量微分

看板Math作者 (Totto)時間6年前 (2019/09/22 12:12), 6年前編輯推噓9(9026)
留言35則, 3人參與, 6年前最新討論串1/1
因為搞ML跑去看線代啟示錄對矩陣/向量微分表示法的推導 但有個部分看不太懂 https://imgur.com/2Vfh7IP
原文說f(u),u(x),v(x)為可微分函數 看起來 若x屬於R^n 這裡應該是指 u:R^n→R^m, u(x)=(u1(x),u2(x),...,um(x)), for some m f應該也是類似的定義 f:R^m→R^a, f(x)=(f1(u),f2(u),...,fa(u)), for some a 以上不知有沒有理解錯誤 以下是問題及我的理解 1→2這步,若把f.u看成函數,根據連鎖率推得2似乎是對的 但是2→3就看不懂了qq 因為以前學微積分只學過單變數的向量函數 像r:R→R^n, r(t) = (r1(t),r2(t),...,rn(t)) 且r'(t) = (r1'(t),r2'(t),....,rn'(t)) 如果推廣到多變數 那這邊的du/dxi = (du1/dxi,du2/dxi,...dum/dxi) 另外,dfj/du應該是指fj'(u)? 所以(du/dxi)(dfj/du)應該是一個向量乘上純量 這樣2是如何推到3的呢? 不知道是哪裡想錯了...請高手解救,謝謝 原文: https://reurl.cc/5grRz6 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.3.78 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Math/M.1569125561.A.635.html

09/22 12:48, 6年前 , 1F
雖然無關內容,不過為什麼不換個縮址就好?
09/22 12:48, 1F
原來是ptt縮網址的問題...我以為是PTT會自動擋 ※ 編輯: TEPLUN (1.160.3.78 臺灣), 09/22/2019 13:09:13

09/22 13:14, 6年前 , 2F
那是ppt縮網址
09/22 13:14, 2F

09/22 14:02, 6年前 , 3F
2的u拆開就是3
09/22 14:02, 3F
就是這裡不懂兩邊的u怎麼拆成uk的

09/22 14:03, 6年前 , 4F
dfj/du應該是指fj'(u)沒錯
09/22 14:03, 4F
※ 編輯: TEPLUN (1.160.3.78 臺灣), 09/22/2019 16:20:04

09/22 17:11, 6年前 , 5F
[du1/dxi du2/dxi ... ][dfj/du1 dfj/du2 ... ]^T
09/22 17:11, 5F

09/22 17:13, 6年前 , 6F
前面有提到「...本文採用混合佈局...」
09/22 17:13, 6F

09/22 17:13, 6年前 , 7F
所以寫成這樣
09/22 17:13, 7F

09/22 18:34, 6年前 , 8F
09/22 18:34, 8F

09/22 18:35, 6年前 , 9F
推dlhz大,維基的這個條目會告訴你向量和純量互相
09/22 18:35, 9F

09/22 18:36, 6年前 , 10F
求導是放直的橫的,還有形式怎樣,你套進去也可得
09/22 18:36, 10F

09/22 18:39, 6年前 , 11F
一個直和一個橫相乘剛好是內積。f:R^n->R^m的微分是
09/22 18:39, 11F

09/22 18:39, 6年前 , 12F
m by n的矩陣
09/22 18:39, 12F

09/22 18:40, 6年前 , 13F
更正一個橫*一個直,*是矩陣乘法,如d大所寫
09/22 18:40, 13F
我知道這裡採用分母布局 的確如果2用分母布局來想 可以推得3 但如果單純是先用連鎖率推到2再用分母布局去想就有個問題 (du/dxi)(dfj/du)=(dfj/du)(du/dxi) 這樣結果就不一樣了 所以我本來把他當成跟單變數連鎖率一樣處理顯然是錯的 但這樣看起來1→2應該類似多變數合成向量函數的微分的連鎖率 2其實是兩個gradient做內積 但以前只學過f(r(t))對t的微分是f的gradient跟r'內積 t為單變數 如何把t推廣到多變數?這步如何證明就不是很清楚 ※ 編輯: TEPLUN (220.136.16.107 臺灣), 09/23/2019 08:45:33

09/23 22:55, 6年前 , 14F
個人意見,你觀察得很好,我認為周老師的矩陣位置
09/23 22:55, 14F

09/23 22:56, 6年前 , 15F
放錯了。你可以看一下wiki矩陣微積分放的ij位置
09/23 22:56, 15F

09/23 23:00, 6年前 , 16F
不影響後續證明,反正就i,j顛倒。我覺得維基這部分
09/23 23:00, 16F

09/23 23:00, 6年前 , 17F
寫得很好。
09/23 23:00, 17F

09/23 23:10, 6年前 , 18F
位置的部分你要這樣想:f:R^n->R^m,f寫成f1...fm
09/23 23:10, 18F

09/23 23:12, 6年前 , 19F
f=f(x_1...x_n)原因是方程a11x1+a12x2+...a1nxn=f1
09/23 23:12, 19F

09/23 23:12, 6年前 , 20F
共m條方程,n個變數,m的標記是i,n的標記是j
09/23 23:12, 20F

09/23 23:15, 6年前 , 21F
這樣你就知道為啥向量微分向量矩陣是那樣放,這個
09/23 23:15, 21F

09/23 23:15, 6年前 , 22F
東西印象是jacobian發展的雅可比矩陣,也讓雅可比
09/23 23:15, 22F

09/23 23:16, 6年前 , 23F
聲名大噪,當代有名的問題重積分的變數變換解決
09/23 23:16, 23F

09/23 23:30, 6年前 , 24F
根據這個規則,純量當作1維向量,你就知道向量微分
09/23 23:30, 24F

09/23 23:31, 6年前 , 25F
純量是直的,純量微分向量是橫的。
09/23 23:31, 25F

09/24 00:06, 6年前 , 26F
u1到uL才對,L index k ,n維映至l維再映至m維才對
09/24 00:06, 26F

09/24 00:08, 6年前 , 27F
x n維 ,u 是n維映至L維 ,f是L維映至
09/24 00:08, 27F

09/24 00:08, 6年前 , 28F
m維
09/24 00:08, 28F

09/24 00:16, 6年前 , 29F
u為什麼L維可以看frideberg矩陣乘法那裡.周老師不是
09/24 00:16, 29F

09/24 00:16, 6年前 , 30F
錯,只是寫ij和frideberg和維基不同。我會用fridebe
09/24 00:16, 30F

09/24 00:16, 6年前 , 31F
rg的習慣。
09/24 00:16, 31F

09/24 00:17, 6年前 , 32F
用周老師的寫法鏈式會前後顛倒,這就是。frideberg
09/24 00:17, 32F

09/24 00:17, 6年前 , 33F
方法較佳的原因。
09/24 00:17, 33F

09/24 00:48, 6年前 , 34F
https://reurl.cc/4ga0LK 複合函數微分,例子有矩陣
09/24 00:48, 34F

09/24 00:49, 6年前 , 35F
啟示錄開頭寫n*m讓複合公式顛倒了。
09/24 00:49, 35F
文章代碼(AID): #1TXlIvOr (Math)