Re: [討論] sora效率：800塊A100跑一天出一分鐘產品

看板HatePolitics作者cc1plus (廢柴聯盟盟主)時間2月前 (2024/03/11 14:26)推噓1(1推 0噓 6→)

留言7則, 3人參與討論串3/3 (看更多)

※ 引述《yoyoruru (哇系笨阿佑)》之銘言： : 一張 A100，大概1萬鎂 : 算算就一個電影動畫師的平均月薪 : 買來玩個一年 : 「很貴嗎？」我還覺得底層是跑 Unreal engine 跑出來的應該有人在朝這方向做了如果是產生的我只能說，失誤率太高沒有必要看起來很炫但是不實用看大家興奮成那樣我也是黑人問題，妥妥的炒股比起來，Nvidia 前架構師離職這篇論文才更有意思 https://www.facebook.com/nanzong.chen/posts/ pfbid026y5WwQRz2tvCcAG5jTWiFAbcyqLv3CFU92vTBZHPrSZXhuWg3fmaXxiPGv6yyjjml (接成一行, 懶得縮了) 加州理工學院(Caltech)的布倫教授(Bren Professor) 「我們首次證明，LLaMA 7B可以在僅具有24GB記憶體的單一消費級GPU(RTX 4090)上進行預訓練(不是微調！)。這意味著訓練期間用於儲存優化器狀態的記憶體減少了82.5%以上。」這個才是大新聞，降低大語言模型 training 的記憶體使用量大家算大語言模型的成本大幅降低 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.0.12 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/HatePolitics/M.1710138390.A.183.html

→

indium111

03/11 14:35, 2月前 , 1^F

03/11 14:35, 1^F

→

indium111

03/11 14:35, 2月前 , 2^F

03/11 14:35, 2^F

→

indium111

03/11 14:35, 2月前 , 3^F

03/11 14:35, 3^F