Re: [問題] 我媽問我的兩個問題

看板Inference作者 (好多目標)時間17年前 (2007/04/03 00:50), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串6/11 (看更多)
※ 引述《ddavid (星舞絃獨角獸神話憶)》之銘言: : 以下通用式可以輕鬆弄出任意解: : (x - 1)(x - 2)...(x - n) : f(x) = ──────────── + g(x) : a : 其中分子n是代入所有提供的項數,m是一個隨意可變的值,g(x)是出題者預想的 : 答案。比如1, 2, 4, ?, 16這個數列,我們會直覺想式子是2^(x - 1),猜?是8,但 : : : (x - 1)(x - 2)(x - 3)(x - 5) : f(x) = ────────────── + 2^(x - 1) : a : 在x = 1, 2, 3, 5時前面為0,所以答案剛好分別是1, 2, 4, 16。但代入4得到 : 的是-(6/a) + 8。只要隨意調整a的值,就會形成一個1, 2, 3, 5項都符合題目但第 : 4項(及其他項)有任意可能的新數列。 這個已經 overfit 了吧 在統計上,你有一堆 x 與 f(x) 的實驗數據,還帶有誤差,要去找出這個 f() 。正常的做法,是盡量用「越少文字越好」的方法去描述 f()。當你有新的數據 時,通常仍然會符合你求出來的 f()。當然你可以用你的方法去做 f(),你的公 式用了相當多的文字,可以完美地通過數據中每一個點,但是當有新的數據進來 後,幾乎是一定不可能符合你的 f() 的,你還必須修正,等於你的 f() 沒有意 義,這個稱為 overfitting。 這種題目,就是要用盡量少的文字去表示它的規律。 -- Just because you deserve this doesn't mean they're gonna give it to you. Sometimes you gotta take what's yours. ── Kenny Ray Carter -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 138.23.2.34
文章代碼(AID): #164JH1th (Inference)
討論串 (同標題文章)
文章代碼(AID): #164JH1th (Inference)