討論串(共2篇) - Google TurboQuant 記憶體壓縮突 - 看板Marginalman

看板 [ Marginalman ]

討論串Google TurboQuant 記憶體壓縮突

共 2 篇文章

排序：最新先 | 最舊先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

Re: Google TurboQuant 記憶體壓縮突

推噓0(0推 )留言0則，0人參與作者h0103661 (單推人) 每日換婆 (1/1)時間1天前 (2026/03/26 14:38)資訊

內容預覽:

※ 引述《pchooooome (千石ユノ的胎盤)》之銘言. 這個是上下文量化. 先不談論這個量化損失度，畢竟這個得實測. 算一下理論上的記憶體使用量. 拿DeltaNet上下文架構的Qwen3.5為例. 8k 壓縮前: 0.26, 壓縮後: 0.03. 32k 壓縮前: 1.05, 壓縮後: 0.

(還有208個字)

Google TurboQuant 記憶體壓縮突

推噓7(7推 )留言15則，0人參與作者pchooooome (千石ユノ的胎盤)時間1天前 (2026/03/26 08:47)資訊

內容預覽:

Google TurboQuant 記憶體壓縮突. Google 推出新 AI 記憶體壓縮演算法 TurboQuant,可將 AI 的「工作記憶體」壓縮高達6倍。. 哇靠真假，這樣本地跑超大模型，的日子是不是要來了. 挖苦挖苦. --. https://imgur.com/ND9GK2l.gif.

首頁

尾頁