Re: [問題] 我媽問我的兩個問題

看板Inference作者 (星舞絃獨角獸神話憶)時間17年前 (2007/04/03 02:41), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串7/11 (看更多)
※ 引述《eieio (好多目標)》之銘言: : 這個已經 overfit 了吧 : 在統計上,你有一堆 x 與 f(x) 的實驗數據,還帶有誤差,要去找出這個 f() : 。正常的做法,是盡量用「越少文字越好」的方法去描述 f()。當你有新的數據 : 時,通常仍然會符合你求出來的 f()。當然你可以用你的方法去做 f(),你的公 : 式用了相當多的文字,可以完美地通過數據中每一個點,但是當有新的數據進來 : 後,幾乎是一定不可能符合你的 f() 的,你還必須修正,等於你的 f() 沒有意 : 義,這個稱為 overfitting。 : 這種題目,就是要用盡量少的文字去表示它的規律。 是的,統計是如此,但是這並不是統計,這些數據並不含有其原始意義告訴我們 該用哪一種解釋更為可能接近需要的答案。 舉一個小例子,1 2 3請問下一個數?你也許直覺以自然數列回答4,但是在某些 領域的特定問題上(比如,遞迴演算法時間複雜度評估),我們會更偏向於回答5, 因為它同樣是大家熟知的費式數列中連續三項。 回到我的上一篇,那個f(x)很有可能是某種評估函數或距離函數,其中當x落在 點1、2、3及5的時候存在一個意義,同時我們還希望數線上以這四個點分成的五個區 間之評估值正負相間。而此時那個數列代表的意義就是由自然數列轉換為它們的距離 值數列,而不是一個二的次方數列。 也許你會說這有點強詞奪理,但事實是當一些數字不存在其物理或統計意義時, 你就無法判斷哪一個貫穿它們的函數更為合理。 再舉一個例子,1 2 1 2 3 2 1 2 ?,問你?是多少? 你也許直覺想的是1 2 1 2 3 2 1 2 3 4 3 2 1。你說這是個數列會先遞增到n後 遞減到1,然後遞增到n + 1再遞減到1,以此類推。 可是當我回答你答案是1,這就只是九個數字形成的有限項數列,以第五個數做 對稱。這一樣是個合理而極度具有規律並且簡單明確的答案,現在你能告訴我光看題 目,哪一個答案是比較合理的嗎? 又比如一個手上有八位數計算機的人,他輸入2然後一直按開根號,並且將顯示 出來的最低位數列為一個數列。對於同樣有八位計算機且知道這個數列產生法的人來 說這數列簡直淺顯易懂,而且還能輕易舉一反三造出一個以任何數字開始連按根號的 最小位數數列。但是如果你不知道背後它是怎麼產生出來的,你完全不曉得它的意義 ,那你可能想盡辦法去串出一個很複雜的規則來,然而你永遠不會曉得對於了解者來 講,這個數列是被計算機的運算機制及八位數的顯示限制大幅簡化過的一個明確數列 。 -- 「如果你沒法給我個解釋的話,死一萬次也不能彌補你的過錯!」 「我沒辦法死一萬次賠妳啊。」 「可是你有辦法半死兩萬次,知道嗎,嗯?」 --蓮.席斯塔 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.31.182 ※ 編輯: ddavid 來自: 140.112.31.182 (04/03 02:47) ※ 編輯: ddavid 來自: 140.112.31.182 (04/03 03:00)
文章代碼(AID): #164KvtyV (Inference)
討論串 (同標題文章)
文章代碼(AID): #164KvtyV (Inference)