[問題] 怎麼確保資料分布跟真實世界相近 ?

看板DataScience作者sssh (叫我松高魂 ~~)時間5年前 (2020/05/27 10:14)推噓5(5推 0噓 6→)

留言11則, 6人參與討論串1/1

最近進行一些電腦視覺的專案，發現實在很難確認收集來的資料(圖片)到底夠不夠貼近真實世界的狀況。舉例來說，我用一個開放資料集，以這個資料集為基礎上可以取得相當不錯的訓練成果，但發現在真實世界的推論卻達不到標準。回過頭來看，如果要加資料，也不知道可以怎麼加，要加上哪種資料才可以讓模型更 robust 想請教大家，在收集資料上面，都是怎麼確保資料的品質 ? 不管是圖像資料或是量化資料，要用什麼方式或從什麼面向來確定自己的資料本身是沒問題的呢 ? -- ◤ ◤ ◣ ● Ο ο ◤ ◣ ◣ ◣ ◤ 。 ο ○ 。 ○ °● ◣ ≡ ◤ ° ο Ο ◣ ◤ ◤ ◣ ≡ ◤ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.115.192.106 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1590545693.A.2A0.html

推

p122607

05/27 15:29, 5年前 , 1^F

05/27 15:29, 1^F

推

ddavid

05/27 17:52, 5年前 , 2^F

05/27 17:52, 2^F

→

ddavid

05/27 17:53, 5年前 , 3^F

05/27 17:53, 3^F