Vision Transformers Need Registers

看板Marginalman作者sustainer123 (溫水佳樹的兄長大人)時間1周前 (2025/12/30 18:22)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串1/1

這篇是處理vit特徵圖的雜訊問題大抵來說背景會出現高norm的點這些點大多數是沒啥資訊的背景這些背景會丟失局部訊息並overfit全局訊息換言之我們可以說這些雜訊被模型當成全局訊息的暫存器解決方法就是加幾個token當暫存器訓練完丟掉我測試對模型效果沒提升然後加的token越少降低越少 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.136.82.186 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1767090138.A.0A2.html

‣ 返回看板[ Marginalman ] 聲優

‣ 更多 sustainer123 的文章

文章代碼(AID): #1fKwVQ2Y (Marginalman)