討論串Google TurboQuant 記憶體壓縮突
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者h0103661 (單推人) 每日換婆 (1/1)時間1天前 (2026/03/26 14:38), 編輯資訊
0
0
0
內容預覽:
引述《pchooooome (千石ユノ的胎盤)》之銘言. 這個是上下文量化. 先不談論這個量化損失度,畢竟這個得實測. 算一下理論上的記憶體使用量. 拿DeltaNet上下文架構的Qwen3.5為例. 8k 壓縮前: 0.26, 壓縮後: 0.03. 32k 壓縮前: 1.05, 壓縮後: 0.
(還有208個字)

推噓7(7推 0噓 8→)留言15則,0人參與, 1天前最新作者pchooooome (千石ユノ的胎盤)時間1天前 (2026/03/26 08:47), 編輯資訊
0
1
0
內容預覽:
Google TurboQuant 記憶體壓縮突. Google 推出新 AI 記憶體壓縮演算法 TurboQuant,可將 AI 的「工作記 憶體」壓縮高達6倍。. 哇靠真假,這樣本地跑超大模型,的日子是不是要來了. 挖苦挖苦. --. https://imgur.com/ND9GK2l.gif.
首頁
上一頁
1
下一頁
尾頁