Re: [閒聊]AMD顯卡可以跑CUDA程式,那就不必特地買N

看板PC_Shopping作者 (機掰客家人)時間2月前 (2024/03/02 09:05), 2月前編輯推噓23(24151)
留言76則, 23人參與, 1月前最新討論串2/2 (看更多)
各位早安, 這裡是禮拜六早上的 R&D。 ※ 引述 《amduser (重返榮耀)》 之銘言: :   : 之前新聞 : https://news.mydrivers.com/1/963/963717.htm :   : NVIDIA CUDA通過多年耕耘,鑄就了牢不可破的生態壁壘,外人各種嘗試都無法進入,包 : 括AMD ROCm開發平台,但其實也不是沒有辦法。 : 開發者Andrzej Janik就憑借一己之力,借助Intel oneAPI,開發了CUDA兼容方案“ZLUDA : ”,能夠在Intel硬件上原生運行CUDA應用,后來就被停了 : 之后在AMD的支持下,ZLUDA重啟了該項目,能夠讓AMD顯卡原生運行CUDA應用,不需要任 : 何轉移,也不需要調整代碼。 : 唯一要做的,就是用ZLUDA庫替代CUDA。 : 雖然它不能保證每一款CUDA應用都跑起來,但已經是以一個巨大的突破。 : 非常可惜,AMD支持這一項目做了兩年,也給停了——不知道是不是受到了NVIDIA的壓力 : 。 : 幸運的是,ZLUDA項目并未徹底消散,已經免費開源,感興趣有能力的開發者都可以使用 : ,而且確認可以在AMD ROCm平台上無縫運行CUDA應用。 : 比如說,可以將CUDA作為Blender 4.0或者V-Ray的渲染API,尤其是Blender本來就有 : Radeon HIP計算渲染器,如今跑在ZLUDA上速度還會更快。 : Andrzej Janik也在繼續研究ZLUDA,其中一個目標就是要讓AMD顯卡運行NVIDIA DLSS。 : 內部測試表明,對比OpenCL方案,其性能大部分時候都更好,最多可以領先超過75%,但 : 因為還在開發之中,部分時候效率反而更低。 :   : 大家都知道NVIDIA最喜歡搞特規G-SYNC、DLSS、CUDA、閉源軟體一大堆不開放給其他家用 : ,現在ZLUDA可以讓AMD顯卡跑CUDA程式,那以後就不必特地買N卡了,應該以後會有人拿 : AMD顯卡來搞AI了吧! :   : https://github.com/vosen/ZLUDA :   ZLUDA 這東西我研究過一陣子, 當然不是現在這個 Fork, 而是三年前那個版本。 平台使用 Ubuntu 22.04 64bit 我研究後發現 ZLUDA 的運作原理是這樣: ZLUDA 會去模擬一套 CUDA API, 然後內部再自己實現功能。 這代表什麼呢? 假設你有一套程式支援 CUDA 8 好了, 現在 CUDA 要更新變成 CUDA 9 囉! N 家能在歷史版本裡面找到 舊版CUDA來套, 那你程式就能順利跑了。 如果你用 ZLUDA , 之前的問題就是他只支援某特定版本 CUDA, 還沒有 Released 他是 depend 哪一版? ZLUDA 是照某板的 API 下去寫的! 所以你想支援機器學習框架? (e.g. TensorFlow, PyTorch) 那要先找到這個是用哪版 CUDA, 找到後還要確定這版的框架你裝得起來。 個人是認為這難度: https://i.imgur.com/OBzSNCH.gif
除去框架, 實測能夠用 ZLUDA 跑起來的 CUDA 程式: Geekbench 5 也嘗試過從底層像是 Numba 重寫演算法 拿去 Benchmark performance 。 一樣遇到 Numba 卡版本問題。 退一萬步說 ZLUDA 可能有用, 但是老黃一版更他就會死翹翹, 而且死很久。 開源的東西都這樣,蘇媽也不是做慈善的。 既然主流的框架(e.g. PyTorch) 都有支援 ROCm,幹嘛出大錢搞 ZLUDA? 結論: ZLUDA 要真正可以商用, 就是要有人花錢去幫每一版 CUDA 寫 API, 然後拿出一張表對標版本支援才有用。 現在商用想逃離 NV 還是推 OpenCL 解決方案, 以上。 -- 作者 villagermess (我是女生) 看板 Tech_Job 標題 [討論] 為什麼不開基本薪資 然後分紅給50萬 時間 Fri May 14 10:21:35 2021 ───────────────────────────────────────

05/14 10:31,
只能吸引你 不能吸引人才
05/14 10:31

05/14 10:32,
所以沒人這樣開
05/14 10:32
-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.170.78.182 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1709341524.A.970.html

03/02 09:07, 2月前 , 1F
跟wine概念差不多?
03/02 09:07, 1F
※ 編輯: wuyiulin (1.170.78.182 臺灣), 03/02/2024 09:11:05

03/02 09:18, 2月前 , 2F
應該就是 然後這部分除非CUDA的API公開
03/02 09:18, 2F

03/02 09:18, 2月前 , 3F
不然很難跟得到
03/02 09:18, 3F

03/02 09:19, 2月前 , 4F
你也不是有個Valve 盡量幫你通通接好
03/02 09:19, 4F

03/02 09:36, 2月前 , 5F
就好像買mac裝windows 一樣, 不用人家
03/02 09:36, 5F

03/02 09:36, 2月前 , 6F
的生態還要裝, 要泡cuda 買nv 就好 ,
03/02 09:36, 6F

03/02 09:36, 2月前 , 7F
qemu 比較貼切
03/02 09:36, 7F

03/02 09:37, 2月前 , 8F
或是 Windows 內的 WSL 跟真 linux
03/02 09:37, 8F

03/02 09:48, 2月前 , 9F
不只是版本問題,ZLUDA三年後還是Alpha版
03/02 09:48, 9F

03/02 09:49, 2月前 , 10F
相容性很差,除了一些Benchmark,正常程式
03/02 09:49, 10F

03/02 09:51, 2月前 , 11F
幾乎沒一個可用。最重要的Pytorch支援也完
03/02 09:51, 11F

03/02 09:52, 2月前 , 12F
全不行。Intel跟AMD都相繼放棄不是沒原因
03/02 09:52, 12F

03/02 10:23, 2月前 , 13F
對AMD on Windows來說,
03/02 10:23, 13F

03/02 10:23, 2月前 , 14F
就像是效率比較好的DirectML.
03/02 10:23, 14F

03/02 10:23, 2月前 , 15F
借問Rocm目前支援度如何
03/02 10:23, 15F

03/02 10:23, 2月前 , 16F
推薦買嗎
03/02 10:23, 16F

03/02 10:24, 2月前 , 17F
pytorch
03/02 10:24, 17F

03/02 10:26, 2月前 , 18F
linux系統的話
03/02 10:26, 18F

03/02 10:34, 2月前 , 19F
Pytorch支援ROCM,但要有能力debug,
03/02 10:34, 19F

03/02 10:35, 2月前 , 20F
最好用docker,常常需要重新設定。最重要
03/02 10:35, 20F

03/02 10:37, 2月前 , 21F
的事,選有支援GPU,現在要7900xtx/xt/gre
03/02 10:37, 21F

03/02 10:50, 2月前 , 22F
03/02 10:50, 22F

03/02 11:11, 2月前 , 23F
牙膏one API 有一部分是在做類似的事情
03/02 11:11, 23F

03/02 11:11, 2月前 , 24F
啊 不過人家是商業團隊一堆人在寫 都問
03/02 11:11, 24F

03/02 11:11, 2月前 , 25F
題不少了
03/02 11:11, 25F

03/02 11:45, 2月前 , 26F
推實測說明
03/02 11:45, 26F

03/02 11:55, 2月前 , 27F
7系列都能跑rocm啊至少我畫圖沒問題,
03/02 11:55, 27F

03/02 11:55, 2月前 , 28F
誰說要7900的
03/02 11:55, 28F

03/02 11:56, 2月前 , 29F
你先看那是什麼ID
03/02 11:56, 29F

03/02 12:23, 2月前 , 30F
03/02 12:23, 30F

03/02 12:24, 2月前 , 31F
人家在問linux跑pytorch rocm結果你在說
03/02 12:24, 31F

03/02 12:24, 2月前 , 32F
畫圖 更好笑的是有人要洗別人粉絲意向單
03/02 12:24, 32F

03/02 12:24, 2月前 , 33F
官方就真的寫只支援那三張(遊戲卡)
03/02 12:24, 33F

03/02 12:26, 2月前 , 34F
沒有裝過的別裝懂好嗎
03/02 12:26, 34F

03/02 12:30, 2月前 , 35F
官方只有保證那三張可以穩跑 其他出
03/02 12:30, 35F

03/02 12:30, 2月前 , 36F
錯要自己debug
03/02 12:30, 36F

03/02 12:31, 2月前 , 37F
SD在linux上是用ROCm的torch框架
03/02 12:31, 37F

03/02 13:02, 2月前 , 38F
對公司這等級的就花錢了事買Nvidia工程繪
03/02 13:02, 38F

03/02 13:02, 2月前 , 39F
圖卡,在誰在跟你搞土炮在那搞來搞去的
03/02 13:02, 39F

03/02 13:12, 2月前 , 40F
這種api串接有沒有專門的名詞啊,常常聽
03/02 13:12, 40F

03/02 13:12, 2月前 , 41F
到執行編譯需要軟體A特定版本B配C平台
03/02 13:12, 41F

03/02 13:22, 2月前 , 42F
開發者本來在I家上班的 初始是I家的專案
03/02 13:22, 42F

03/02 13:23, 2月前 , 43F
後來弄一弄I家覺得沒搞頭 換AMD贊助這個
03/02 13:23, 43F

03/02 13:23, 2月前 , 44F
專案 但是AMD後來也覺得沒搞頭 所以依照
03/02 13:23, 44F

03/02 13:24, 2月前 , 45F
跟AMD的合約才開源
03/02 13:24, 45F

03/02 14:28, 2月前 , 46F
畢竟我自家也有,為什麼要跑你的CUDA
03/02 14:28, 46F

03/02 14:29, 2月前 , 47F
AMD還有hipify能轉換CUDA原始碼
03/02 14:29, 47F

03/02 16:28, 2月前 , 48F
給AI寫不就好了
03/02 16:28, 48F

03/02 17:14, 2月前 , 49F
A卡乖乖玩遊戲就好了 別搞這些有的沒的
03/02 17:14, 49F

03/02 17:15, 2月前 , 50F
比windows arm跑x86程式還沒意義
03/02 17:15, 50F

03/02 17:45, 2月前 , 51F
ROCm官網保證特定消費顯卡,但其他卡
03/02 17:45, 51F

03/02 17:45, 2月前 , 52F
其實也有機會跑。我這邊Linux+ROCm 6
03/02 17:45, 52F

03/02 17:45, 2月前 , 53F
+RX6600可以跑Pytorch。雖然我也是玩S
03/02 17:45, 53F

03/02 17:45, 2月前 , 54F
D畫圖。
03/02 17:45, 54F

03/02 17:47, 2月前 , 55F
身為非開發者的我,遇到的問題是要特
03/02 17:47, 55F

03/02 17:47, 2月前 , 56F
定的Pytorch版本才能跑(我沒在Docker
03/02 17:47, 56F

03/02 17:47, 2月前 , 57F
上跑)
03/02 17:47, 57F

03/02 18:55, 2月前 , 58F
不支援的GPU其實大部分可跑,但問題會更多
03/02 18:55, 58F

03/02 18:56, 2月前 , 59F
而且不能file bug report。換句話說,真有
03/02 18:56, 59F

03/02 18:57, 2月前 , 60F
問題,AMD不會處理。現在ROCM的AI相容性
03/02 18:57, 60F

03/02 18:58, 2月前 , 61F
越來越好,花點錢買有在支援名單上的划算
03/02 18:58, 61F

03/02 19:13, 2月前 , 62F
所以rocm其實可以嘗試的意思吧,nv的
03/02 19:13, 62F

03/02 19:13, 2月前 , 63F
卡又貴又難買,有事沒事還缺貨
03/02 19:13, 63F

03/02 19:15, 2月前 , 64F
我看7900xtx fp32比4080s還高
03/02 19:15, 64F

03/02 19:36, 2月前 , 65F
可以嘗試,但4080s的ai會比較強,n家有
03/02 19:36, 65F

03/02 19:36, 2月前 , 66F
tensor core。但7900xtx有24GB,大記憶體
03/02 19:36, 66F

03/02 19:37, 2月前 , 67F
比效能要重要。
03/02 19:37, 67F

03/02 19:39, 2月前 , 68F
但這建立在你能處理問題上。n家的ai是沒
03/02 19:39, 68F

03/02 19:40, 2月前 , 69F
煩惱,支援完整。
03/02 19:40, 69F

03/02 19:58, 2月前 , 70F
AMD這點沒辦法.但時間可以解決就是
03/02 19:58, 70F

03/02 19:59, 2月前 , 71F
AI方面A卡支援度會越來越好就是.
03/02 19:59, 71F

03/02 19:59, 2月前 , 72F
不考慮生產力7900XTX就是比4080S強的
03/02 19:59, 72F

03/02 20:06, 2月前 , 73F
nvidia f u
03/02 20:06, 73F

03/02 21:21, 2月前 , 74F
tensor core要L40s才完全解放性能
03/02 21:21, 74F

03/03 14:04, 1月前 , 75F
畢竟大家都要Second Source
03/03 14:04, 75F

03/03 14:05, 1月前 , 76F
牙膏看起來就是沒有方案 Altera 都拆分了
03/03 14:05, 76F
文章代碼(AID): #1budjKbm (PC_Shopping)
文章代碼(AID): #1budjKbm (PC_Shopping)