極值判別法則 Part 1

看板trans_math作者 (.......................)時間16年前 (2009/12/16 17:58), 編輯推噓3(3017)
留言20則, 3人參與, 最新討論串1/1
※ 引述《midarmyman (midarmyman)》之銘言: : 偏微分求極值時,判別式大於零之外, : 還要看fxx如果>0就是極小,反之 : 請問為啥要看fxx不看fyy? : 遇到一題變數不是x.y不知道該看哪個(不過都正) [我先給 Part 1, 假使有必要後面還有 Part 2-5.] 以下將講多變數函數世界裡頭的極值判別法則,而單變數中的極值判別法則相對於多變數 中的極值判別法則來的簡單,故省略。 (引理) 命 f:S → |R, 其中 S is open in |R^n with a in S, 且 f 於 a 點有方向 導數。若 f(a) 為極值點,則 D_u f(a) = 0. ↓ kth component 特別地,選取 u = u_k = (0,...,1,...,0), 則 D_k f(a) = 0 for all k = 1,2,...,n. 也就是說,此時 ▽f(a)=0. 因此,欲深究一內點 a 是否為極值點,我們就必須先假定 ▽f(a)=0. 再來回憶 f(a+k) = f(a) + ▽f(a).k + (1/2!) <Hk,k> + R_a,2(k), 其中 H = H(a), Hessian matrix of f at a. NOTE. 只要談論到極值問題往往就會涉及到泰勒定理(具備餘項)。 (主定理) 假定 ▽f(a)=0, 即 a 點為 critical point, 且二階偏導數 D_i,j f(x) 存在於 B(a), 且連續於 a 點上。 (1) 若 < Hk,k> 恆正 for all k ≠ 0, 則 f(a) 為 local minimum. (2) 若 < Hk,k> 恆負 for all k ≠ 0, 則 f(a) 為 local maximum. (3) 若 < Hk,k> 有正有負,則 a 點為 saddle point (鞍點)。 (鞍點定義) 若 a 為 critical point 且對於任意的 B(a) 中有點 x, y 使得 f(x) > f(a) 且 f(y) < f(a) 則稱 a 點為鞍點。 由此可見,鞍點必定不是極值點。 Proof. 我們需要兩個 lemmas: (lemma 1) 若 H>0,則必存在一正數 c, 使得< Hk,k> ≧ c|k|^2 for all k. (lemma 2) |R_a,2(k)|/|k|^2 → 0 as k→ 0. 由上述兩引理,可證明此主定理。 NOTE. (i) 由二階偏導數 D_i,j f(x) 存在於 B(a), 且連續於 a 點上, 可知 H 為對稱 矩陣,即 H^t = H. (ii) 對一個對稱矩陣 H 而言, 當 < Hk,k> 恆正 for all k ≠ 0, 我們稱 H 為正定,且記為 H > 0. 當 < Hk,k> 恆負 for all k ≠ 0, 我們稱 H 為負定,且記為 H < 0. (正定原文為 positive definite, 負定原文為 negative definite.) 因此根據上述主定理可知: 當 a 為 critical point 時,且 Hessian matrix H(a) > 0 表示 f(a) 有局部極小。 簡記為 {▽f(a) = 0} + {H(a) > 0} => f(a): local min. 當 a 為 critical point 時,且 Hessian matrix H(a) < 0 表示 f(a) 有局部極大。 簡記為 {▽f(a) = 0} + {H(a) < 0} => f(a): local max. (iii) ╭ D_11 f(a) ... D_1n f(a) ╮╭ k_1 ╮ ╭ k_1 ╮ <Hk,k> = < │ ... ... ... ││ . │ │ . │> ╰ D_n1 f(a) ... D_nn f(a) ╯╰ k_n ╯ ,╰ k_n ╯ n n = Σ Σ D_ij f(a) k_i k_j. i=1 j=1 即 H:|R^n→|R by H(k):= <Hk,k>. 如此之 H 稱為二次型 (Quadratic form.) (iv) 主定理告訴了我們一件重要的事情:在主定理的假設底下,餘項對我們來說一 點也不重要,也就是說餘項不會影響到函數本身的極值問題。即腦海要想著 f(a+k) ~ f(a) + (1/2!) <Hk,k> (因 ▽f(a) = 0) 這樣一來,f(a+k) - f(a) ~ (1/2!) <Hk,k>. 因此,f(a+k) - f(a) 的正負可由 <Hk,k> 決定之。 (v) 最後提到一點線性代數,他將用在 Part 2 裡頭的推論 1. 對一個對稱矩陣 H 而言: H > 0 <=> H 的所有 eigenvalues 都必須恆正。 H < 0 <=> H 的所有 eigenvalues 都必須恆負。 -- Good taste, bad taste are fine, but you can't have no taste. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.133.4.14

12/16 18:01, , 1F
midarmyman 要問的東西在 Part 4.
12/16 18:01, 1F

12/16 18:13, , 2F
小弟知識淺薄 似乎不大懂
12/16 18:13, 2F

12/16 18:14, , 3F
不過還想請問如果兩個變數不是x.y那要
12/16 18:14, 3F

12/16 18:14, , 4F
看哪個變數的二階偏導數呢?
12/16 18:14, 4F

12/16 18:15, , 5F
不是這樣說的...你得去看 Hessian Matrix
12/16 18:15, 5F

12/16 18:16, , 6F
只有雙變數時, 這時候產生的 Hessian
12/16 18:16, 6F

12/16 18:16, , 7F
Matrix 是 2*2 矩陣. 因此此矩陣的正負定
12/16 18:16, 7F

12/16 18:17, , 8F
可以看出是為極值點...
12/16 18:17, 8F

12/16 18:17, , 9F
而你說的結論是正負定的 2x2 的特殊例子
12/16 18:17, 9F

12/16 18:22, , 10F
唉 線性代數現在才上到eigenvaluel
12/16 18:22, 10F

12/16 18:24, , 11F
那以後遇到這種怎辦?
12/16 18:24, 11F

12/16 18:25, , 12F
遇到什麼? 看不懂就先背 2x2 的情況...
12/16 18:25, 12F

12/16 18:26, , 13F
我的記憶方法是直接看 y = x^2.
12/16 18:26, 13F

12/16 18:26, , 14F
這函數在 0 點導數是 0. 二階導數為 2.
12/16 18:26, 14F

12/16 18:27, , 15F
因此這函數極小點發生在 x = 0. (事實上,
12/16 18:27, 15F

12/16 18:27, , 16F
是最小點.) 反之, y = -x^2 在原點產生
12/16 18:27, 16F

12/16 18:28, , 17F
極大點.
12/16 18:28, 17F

12/16 18:31, , 18F
我PO題目
12/16 18:31, 18F

12/16 18:37, , 19F
我寫在原文了
12/16 18:37, 19F

12/16 22:03, , 20F
有神 快拜
12/16 22:03, 20F
文章代碼(AID): #1BAAzFwA (trans_math)