Re: [討論] sora效率:800塊A100跑一天出一分鐘產品
※ 引述《yoyoruru (哇系笨阿佑)》之銘言:
: 一張 A100,大概1萬鎂
: 算算就一個電影動畫師的平均月薪
: 買來玩個一年
: 「很貴嗎?」
我還覺得底層是跑 Unreal engine 跑出來的
應該有人在朝這方向做了
如果是產生的我只能說,失誤率太高沒有必要
看起來很炫但是不實用
看大家興奮成那樣我也是黑人問題,妥妥的炒股
比起來,Nvidia 前架構師離職這篇論文才更有意思
https://www.facebook.com/nanzong.chen/posts/
pfbid026y5WwQRz2tvCcAG5jTWiFAbcyqLv3CFU92vTBZHPrSZXhuWg3fmaXxiPGv6yyjjml
(接成一行, 懶得縮了)
加州理工學院(Caltech)的布倫教授(Bren Professor)
「我們首次證明,LLaMA 7B可以在僅具有24GB記憶體的單一消費級GPU(RTX 4090)上
進行預訓練(不是微調!)。這意味著訓練期間用於儲存優化器狀態的記憶體減少
了82.5%以上。」
這個才是大新聞,降低大語言模型 training 的記憶體使用量
大家算大語言模型的成本大幅降低
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.0.12 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/HatePolitics/M.1710138390.A.183.html
→
03/11 14:35,
2月前
, 1F
03/11 14:35, 1F
→
03/11 14:35,
2月前
, 2F
03/11 14:35, 2F
→
03/11 14:35,
2月前
, 3F
03/11 14:35, 3F
→
03/11 14:47,
2月前
, 4F
03/11 14:47, 4F
→
03/11 14:47,
2月前
, 5F
03/11 14:47, 5F
→
03/11 14:48,
2月前
, 6F
03/11 14:48, 6F
推
03/11 16:00,
2月前
, 7F
03/11 16:00, 7F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 3 篇):