[問題] neural net MT 的 Validation set 到底在做什麼?

03/22 12:46, 7年前 , 1^F

03/22 12:46, 1^F

→

03/22 12:46, 7年前 , 2^F

03/22 12:46, 2^F

→

03/22 12:46, 7年前 , 3^F

03/22 12:46, 3^F

→

03/22 12:46, 7年前 , 4^F

03/22 12:46, 4^F

→

03/22 12:46, 7年前 , 5^F

03/22 12:46, 5^F

→

03/22 12:46, 7年前 , 6^F

03/22 12:46, 6^F

→

03/22 12:46, 7年前 , 7^F

03/22 12:46, 7^F

→

03/22 12:58, 7年前 , 8^F

03/22 12:58, 8^F

→

03/22 12:59, 7年前 , 9^F

03/22 12:59, 9^F

推

siscon

03/22 13:02, 7年前 , 10^F

03/22 13:02, 10^F

我回去查了文獻 (我做的是機器翻譯) 有這段話（https://arxiv.org/abs/1709.07809 page 18） "A common stopping criteria is to check progress of the model on a validation set (that is not part of the training data) and halt when the error on the validation set does not improve. Training longer would not lead to any further improvements and may even degrade performance due to overfitting. " 這跟siscon大說的相符（一開始手殘i打成u）我用的軟體是OpenNMT 這個軟體要求 val set 又自動停在 epoch 13 這樣說的話是不是OpenNMT搞錯了 validation set 功用呢? (OpenNMT 有個論壇我可以去抱怨一下) ※ 編輯: lucien0410 (68.230.60.98), 03/22/2018 13:18:20 ※ 編輯: lucien0410 (68.230.60.98), 03/22/2018 13:34:13

→

03/22 13:49, 7年前 , 11^F

03/22 13:49, 11^F

→

03/22 13:51, 7年前 , 12^F

03/22 13:51, 12^F

→

03/22 13:52, 7年前 , 13^F

03/22 13:52, 13^F

→

03/22 13:53, 7年前 , 14^F

03/22 13:53, 14^F

→

03/22 13:55, 7年前 , 15^F

03/22 13:55, 15^F

→

03/22 13:56, 7年前 , 16^F

03/22 13:56, 16^F

推

Kazimir

03/22 14:56, 7年前 , 17^F

03/22 14:56, 17^F

→

Kazimir

03/22 14:57, 7年前 , 18^F

03/22 14:57, 18^F

推

woogee

03/22 15:19, 7年前 , 19^F

03/22 15:19, 19^F

推

NBAPredictor

03/22 17:43, 7年前 , 20^F

03/22 17:43, 20^F

推

03/22 20:42, 7年前 , 21^F

03/22 20:42, 21^F

→

03/22 20:42, 7年前 , 22^F

03/22 20:42, 22^F

→

03/22 20:42, 7年前 , 23^F

03/22 20:42, 23^F

→

03/22 20:42, 7年前 , 24^F

03/22 20:42, 24^F

推

03/22 20:46, 7年前 , 25^F

03/22 20:46, 25^F

→

03/22 20:46, 7年前 , 26^F

03/22 20:46, 26^F

推

EGsux

03/22 20:46, 7年前 , 27^F

03/22 20:46, 27^F

推

03/22 20:57, 7年前 , 28^F

03/22 20:57, 28^F

→

03/22 20:58, 7年前 , 29^F

03/22 20:58, 29^F

推

03/22 21:03, 7年前 , 30^F

03/22 21:03, 30^F

→

03/22 21:04, 7年前 , 31^F

03/22 21:04, 31^F

推

03/22 21:07, 7年前 , 32^F

03/22 21:07, 32^F

→

03/22 21:32, 7年前 , 33^F

03/22 21:32, 33^F

→

03/22 21:33, 7年前 , 34^F

03/22 21:33, 34^F

→

03/22 21:33, 7年前 , 35^F

03/22 21:33, 35^F

→

03/22 21:36, 7年前 , 36^F

03/22 21:36, 36^F

→

03/22 21:36, 7年前 , 37^F

03/22 21:36, 37^F

→

03/22 21:38, 7年前 , 38^F

03/22 21:38, 38^F

→

03/22 21:38, 7年前 , 39^F

03/22 21:38, 39^F

→

03/22 23:50, 7年前 , 40^F

03/22 23:50, 40^F

→

03/22 23:50, 7年前 , 41^F

03/22 23:50, 41^F

→

03/22 23:50, 7年前 , 42^F

03/22 23:50, 42^F

推

03/23 01:04, 7年前 , 43^F

03/23 01:04, 43^F

→

03/23 01:05, 7年前 , 44^F

03/23 01:05, 44^F

推

03/23 01:07, 7年前 , 45^F

03/23 01:07, 45^F

推

03/23 01:10, 7年前 , 46^F

03/23 01:10, 46^F

→

03/23 01:10, 7年前 , 47^F

03/23 01:10, 47^F

→

03/23 01:10, 7年前 , 48^F

03/23 01:10, 48^F

goldflower大多謝啦但問一問基本的問題也不錯吧讓有興趣的但還在學的人也來討論討論像是教學的blog的性質這樣的datascience版也不錯吧正如你說的嚴格來說 OpenNMT沒有拿 val set 來調參數而是拿來評估 overfitting 和 convergence 但這又讓我覺得奇怪了這樣的話 epoch的數量應該是自動設定的 converged後自動停止才對但OpenNMT的epoch 又是手動設定的 hyperparameter (預設值是13) 另外結果這個問題真的有人在論壇上問過: http://forum.opennmt.net/t/validation-data/128 那些OpenNMT的developers 也真的自己出來回答滿有意思的 Guillaume Klein說實際上來說 val set 可以來讓做為挑選那個epoch的標準就挑 validation perplexity 最低的那個 ※ 編輯: lucien0410 (68.230.60.98), 03/23/2018 01:32:23

→