Google TurboQuant 記憶體壓縮突

看板Marginalman作者 (千石ユノ的胎盤)時間1天前 (2026/03/26 08:47), 編輯推噓7(708)
留言15則, 10人參與, 1天前最新討論串1/2 (看更多)
Google TurboQuant 記憶體壓縮突 Google 推出新 AI 記憶體壓縮演算法 TurboQuant,可將 AI 的「工作記 憶體」壓縮高達6 倍。 哇靠真假,這樣本地跑超大模型,的日子是不是要來了 挖苦挖苦 -- https://imgur.com/ND9GK2l.gif
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.179.170 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1774486077.A.8B2.html

03/26 08:49, 1天前 , 1F
期待
03/26 08:49, 1F

03/26 08:50, 1天前 , 2F
樂見其成
03/26 08:50, 2F

03/26 08:50, 1天前 , 3F
MU跟SNDK跌超多
03/26 08:50, 3F

03/26 08:51, 1天前 , 4F
拜託早點那個
03/26 08:51, 4F

03/26 08:52, 1天前 , 5F
錢包也壓縮了
03/26 08:52, 5F

03/26 08:53, 1天前 , 6F
親情厚了
03/26 08:53, 6F

03/26 08:53, 1天前 , 7F
mu藥丸:(
03/26 08:53, 7F

03/26 08:55, 1天前 , 8F
這一年前的論文 對啊
03/26 08:55, 8F

03/26 08:56, 1天前 , 9F
真假 那不用記憶體焦慮了
03/26 08:56, 9F

03/26 08:56, 1天前 , 10F
Gimini沒開源可以本地嗎
03/26 08:56, 10F

03/26 08:58, 1天前 , 11F
看咕咕嚕說驗了3個模型 可以套用所有模型
03/26 08:58, 11F

03/26 08:59, 1天前 , 12F
這個是量化3bit,量化技術早就很普及了,要1bit都可以
03/26 08:59, 12F

03/26 08:59, 1天前 , 13F
,直接16倍壓縮,他只是聲稱他的量化幾乎無損
03/26 08:59, 13F

03/26 09:03, 1天前 , 14F
難吧 量化通過基準測試很簡單 但實際用起來就是一坨
03/26 09:03, 14F

03/26 09:04, 1天前 , 15F
真假 他的量化還是會白痴喔 咕咕嚕騙我
03/26 09:04, 15F
文章代碼(AID): #1fn88zYo (Marginalman)
文章代碼(AID): #1fn88zYo (Marginalman)