[問題] rnn的overfitting

看板DataScience作者 (文慧)時間5年前 (2018/08/13 11:26), 編輯推噓2(2011)
留言13則, 5人參與, 5年前最新討論串1/1
大家好,小弟我近來在研究一些sequence model,在computer vision的領域中 我們都知道over fitting意味者泛化能力差,也就是會沒辦法很好的學習到general 的特徵,因而在testing set上面表現不佳。 這裡我想到了一個問題,那對於rnn的model,overfitting又會以怎樣的方式呈獻呢? 倘若是翻譯的問題的話,那overfitting代表每個字都可以被正確的翻譯,那似乎也不差? 請教各位大大惹 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.248.194 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1534130771.A.CD1.html

08/13 13:24, 5年前 , 1F
沒辦法保證蒐集到所有需要被翻譯的sequence吧,overfi
08/13 13:24, 1F

08/13 13:24, 5年前 , 2F
t的話就資料集有限制的狀況(有限的sequence分布)下
08/13 13:24, 2F

08/13 13:24, 5年前 , 3F
正確翻譯比例很高(training set跟test set同一組),
08/13 13:24, 3F

08/13 13:24, 5年前 , 4F
但你有所有目標sequence的分布資料的話也不用做mode
08/13 13:24, 4F

08/13 13:24, 5年前 , 5F
l啦,不是用dictionary就好了嗎
08/13 13:24, 5F

08/13 16:48, 5年前 , 6F
你的例子overfit不代表每個字被正確翻譯 是代表training
08/13 16:48, 6F

08/13 16:48, 5年前 , 7F
set中的seq完全對應 所以有可能改一個字就翻不出來
08/13 16:48, 7F

08/14 21:32, 5年前 , 8F
你說的比較不需要人工智慧吧,IFs系統查表比較適合
08/14 21:32, 8F

08/19 18:40, 5年前 , 9F
這是在翻譯的問題上 那seq2seq model還有用在如 文本摘
08/19 18:40, 9F

08/19 18:40, 5年前 , 10F
08/19 18:40, 10F

08/19 18:40, 5年前 , 11F
那想請問 結果會怎麼表現呢?
08/19 18:40, 11F

08/23 14:23, 5年前 , 12F
你第一段的最後一句就是答案了啊,在沒看過的資料上會表
08/23 14:23, 12F

08/23 14:23, 5年前 , 13F
現的不好,跟 task 沒什麼關係
08/23 14:23, 13F
文章代碼(AID): #1RSFfJpH (DataScience)