作者查詢 / AmibaGelos
作者 AmibaGelos 在 PTT [ DataScience ] 看板的留言(推文), 共20則
限定看板:DataScience
看板排序:
全部PC_Shopping832NBA277NTU-Fantasy191Mathematica155movie153CFantasy103Physics72NTUcourse61NTU_TS57nb-shopping47Gossiping42GO40DataScience20TSHS12nCoV20196DC5Beauty4DSLR4graduate4joke4Math4TOEFL_iBT4phys003C_Chat2Spurs2Agronomy-971B961010XX1B96A013XX1B97A011XX1B98A012XX1B991010XX1BBSmovie1BLAZERS1Cavaliers1civil961HatePolitics1Key_Mou_Pad1LifeSci_961NTU1NTU-Exam1NTU08DFLL1NTUAC961ntuACCT001NTUBA011NTUCE-1001NTUDrama981NTUEE1111NTUfin001NTUIM-191NTUIM-201NTUMEB971NTUmed961NTUmed971NTUmed981NTUmed991NTUMSE-971NTUMT-971NTUPPM-971PH-961PH-991PHX-Suns1phys981Psychology021PT-961Raptors1Stock1VET_991Windows1WomenTalk1<< 收起看板(69)
首頁
上一頁
1
下一頁
尾頁
12F推: 推推 好奇問1M的case可以改用transfer learning嗎?06/15 11:38
14F推: 也是 是偶耍蠢惹lol 用GP至少知道每個點都被utilize06/15 16:14
15F→: w/o bias 不像transfer learning還得有個前置問題06/15 16:14
10F推: 媽媽問我為什麼跪著用電腦06/15 11:35
26F→: 推s大 實現比較重要 原理推導自己try不會太浪費時間06/06 15:16
27F→: 不要像偶自以為coding還行浪費1年優化自刻的mcmc orz06/06 15:16
5F推: slice共用網路的話是類似 但這樣slice間沒有做conv哦11/04 00:12
6F→: 好奇3d image有多大 128*128*128*64ch*4B就0.5G了orz11/04 00:12
8F→: BN雖然好用但BP時所有FP資料都得要存在同一個GPU上05/01 14:40
9F→: 模型太大的話根本做不到,GN可以讓模型大小繼續變大的05/01 14:42
10F→: 同時繼續享受BN帶來的好處 batch大小其實跟BN彼此可以05/01 14:42
11F→: 互相獨立的,可以開1024的batch拆成8組丟到8顆GPU上各05/01 14:43
12F→: 自做BN05/01 14:43
3F推: 最後一次bn/gn後面幾層可加(通常是fc) 但效果可忽略04/19 07:44
6F推: dropout隨機砍會讓bn無法正規化性能下降 最近有篇有04/20 07:32
7F→: 解但相較於純bn只是補回損失 建議先觀望後續發展04/20 07:32
4F推: 大推! 從input來看扣掉需要非0 filter的features 其04/13 12:52
5F→: 它dof是在學noise 用L2的話noise只是rescale 用L1的04/13 12:52
6F→: 話就是把scattering<regularization strength的砍掉04/13 12:52
2F→: L2指數衰減,w不會歸0.L1則是定量減少,斜率不夠就會歸004/05 17:50
首頁
上一頁
1
下一頁
尾頁