[討論] 跑實驗數據要跑多次取平均嗎
大家好
是這樣的
我在做深度學習相關領域的論文
架構差不多好了 但是跑實驗要很久
每做一個實驗就要花上大量的時間
所以我需要固定random seed 跑很多次(Ex.3-5次)取平均嗎
我看同領域其他論文提供的code
有些人會取五次 也有人只跑一次
問學長姐也沒什麼定論
所以請問這部分有什麼慣例或是規定嗎
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.235.174 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/graduate/M.1663258061.A.C7C.html
※ 編輯: jack1218 (114.136.235.174 臺灣), 09/16/2022 00:08:42
推
09/16 00:10,
1年前
, 1F
09/16 00:10, 1F
推
09/16 00:17,
1年前
, 2F
09/16 00:17, 2F
推
09/16 00:33,
1年前
, 3F
09/16 00:33, 3F
推
09/16 01:08,
1年前
, 4F
09/16 01:08, 4F
→
09/16 01:10,
1年前
, 5F
09/16 01:10, 5F
→
09/16 01:10,
1年前
, 6F
09/16 01:10, 6F
推
09/16 01:57,
1年前
, 7F
09/16 01:57, 7F
→
09/16 01:57,
1年前
, 8F
09/16 01:57, 8F
→
09/16 01:57,
1年前
, 9F
09/16 01:57, 9F
請問如果資料集太小
我做k-flod 但是把val set混入train set 這樣做法是可行的嗎
比方說做跑5次flod取平均
原本比例8:2 變成 10:2
※ 編輯: jack1218 (114.136.235.174 臺灣), 09/16/2022 02:08:33
推
09/16 05:22,
1年前
, 10F
09/16 05:22, 10F
感謝回答
我還有一個問題
如果當中使用一個component 不具備reproducibility
(hugging face 的某些transformer固定random seed 還是不會有一樣的結果)
請問實驗上可以無視這個問題嗎
※ 編輯: jack1218 (114.136.235.174 臺灣), 09/16/2022 13:00:24
推
09/16 13:23,
1年前
, 11F
09/16 13:23, 11F
→
09/16 13:24,
1年前
, 12F
09/16 13:24, 12F
推
09/16 13:55,
1年前
, 13F
09/16 13:55, 13F
→
09/16 13:55,
1年前
, 14F
09/16 13:55, 14F
→
09/16 13:57,
1年前
, 15F
09/16 13:57, 15F
→
09/16 13:57,
1年前
, 16F
09/16 13:57, 16F
推
09/16 14:02,
1年前
, 17F
09/16 14:02, 17F
→
09/16 14:02,
1年前
, 18F
09/16 14:02, 18F
→
09/16 14:02,
1年前
, 19F
09/16 14:02, 19F
推
09/16 14:04,
1年前
, 20F
09/16 14:04, 20F
→
09/16 14:05,
1年前
, 21F
09/16 14:05, 21F
→
09/16 14:06,
1年前
, 22F
09/16 14:06, 22F
→
09/16 14:06,
1年前
, 23F
09/16 14:06, 23F
推
09/16 21:52,
1年前
, 24F
09/16 21:52, 24F
→
09/16 21:52,
1年前
, 25F
09/16 21:52, 25F
→
09/16 21:52,
1年前
, 26F
09/16 21:52, 26F
→
09/16 21:52,
1年前
, 27F
09/16 21:52, 27F
→
09/16 21:52,
1年前
, 28F
09/16 21:52, 28F
→
09/16 21:53,
1年前
, 29F
09/16 21:53, 29F
→
09/16 21:54,
1年前
, 30F
09/16 21:54, 30F
推
09/16 23:37,
1年前
, 31F
09/16 23:37, 31F
→
09/16 23:37,
1年前
, 32F
09/16 23:37, 32F
→
09/16 23:37,
1年前
, 33F
09/16 23:37, 33F
→
09/16 23:37,
1年前
, 34F
09/16 23:37, 34F
推
09/16 23:39,
1年前
, 35F
09/16 23:39, 35F
→
09/16 23:39,
1年前
, 36F
09/16 23:39, 36F
推
09/16 23:41,
1年前
, 37F
09/16 23:41, 37F
→
09/16 23:41,
1年前
, 38F
09/16 23:41, 38F
推
09/16 23:44,
1年前
, 39F
09/16 23:44, 39F
→
09/16 23:44,
1年前
, 40F
09/16 23:44, 40F
→
09/16 23:44,
1年前
, 41F
09/16 23:44, 41F
我的資料集雖然只有8000多筆
但是input有影片 文字和聲音 分別使用transformer 效能需求頗高
使用的設備也不盡理想
再加上要跑不少實驗 所以才需要花不少時間
→
09/16 23:45,
1年前
, 42F
09/16 23:45, 42F
推
09/16 23:51,
1年前
, 43F
09/16 23:51, 43F
→
09/16 23:51,
1年前
, 44F
09/16 23:51, 44F
→
09/16 23:51,
1年前
, 45F
09/16 23:51, 45F
→
09/16 23:52,
1年前
, 46F
09/16 23:52, 46F
請問若官方有切分好train val test
先將train val 合併
並且固定random seed 跑5-fold
這樣是比較嚴謹的做法嗎
※ 編輯: jack1218 (114.136.235.174 臺灣), 09/17/2022 02:53:33
※ 編輯: jack1218 (114.136.235.174 臺灣), 09/17/2022 02:58:02
推
09/17 04:42,
1年前
, 47F
09/17 04:42, 47F
→
09/17 04:42,
1年前
, 48F
09/17 04:42, 48F
→
09/17 04:42,
1年前
, 49F
09/17 04:42, 49F
是論文
我說官方提供是發dataset的人有切分好了
→
09/17 08:38,
1年前
, 50F
09/17 08:38, 50F
→
09/17 08:39,
1年前
, 51F
09/17 08:39, 51F
→
09/17 08:40,
1年前
, 52F
09/17 08:40, 52F
我就是看有人的是這樣做的
所以才問這個問題~
但總覺得哪裡怪怪的
※ 編輯: jack1218 (114.136.235.174 臺灣), 09/17/2022 09:47:23
→
09/17 09:48,
1年前
, 53F
09/17 09:48, 53F
→
09/17 10:23,
1年前
, 54F
09/17 10:23, 54F
→
09/17 10:23,
1年前
, 55F
09/17 10:23, 55F
→
09/17 10:25,
1年前
, 56F
09/17 10:25, 56F
推
09/17 11:28,
1年前
, 57F
09/17 11:28, 57F
→
09/17 11:28,
1年前
, 58F
09/17 11:28, 58F
推
09/17 11:30,
1年前
, 59F
09/17 11:30, 59F
真是太感謝你了
請受小弟一拜
推
09/17 12:25,
1年前
, 60F
09/17 12:25, 60F
推
09/17 17:06,
1年前
, 61F
09/17 17:06, 61F
※ 編輯: jack1218 (114.136.235.174 臺灣), 09/17/2022 23:12:34
推
09/19 00:00,
1年前
, 62F
09/19 00:00, 62F
推
09/19 08:33,
1年前
, 63F
09/19 08:33, 63F
討論串 (同標題文章)
完整討論串 (本文為第 1 之 2 篇):
討論
23
63