Re: [問卦] 我朋友說AMD有些程式不支援

看板Gossiping作者 (pony)時間5年前 (2020/09/23 17:38), 編輯推噓6(600)
留言6則, 6人參與, 5年前最新討論串6/6 (看更多)
※ 引述《arrenwu (拉姆真可愛)》之銘言: : ※ 引述《zxcvfr99 (誰も気づかない人)》之銘言: : : 指令集下面說了就不說,說點軟體的 : : 有做科研的應該都有聽過intel mkl吧? : : 這東西就是intel專門開發的數學library : : 你AMD要跑也不是不能跑啦 : : 只是慢到靠北而已 : : 一堆算矩陣的垃圾東西就是會有差這intel還AMD : : 所以搞這方面的可憐肥宅工程師還是老實買intel+nvidia就好 : : 當然如果只是拿去打遊戲那您隨意就好了 : 這個情況現在可能好很多了 : Intel MKL 確實在數值運算上被廣為運用,不管是MATLAB還是Numpy都有使用。 : 而長期以來,AMD CPU因為沒有AVX2的關係被Intel電成豬頭 : 終於,在去年七月的時候,AMD 的第三代Ryzen支援AVX2了! : 但是這樣子還是跑不贏Intel CPU,因為MKL他會認CPU來決定要不要啟用AVX2加速。 : 這也不是Intel耍陰招,因為你用某些很舊的Intel CPU也開不了。 : 情況好轉的部分是: : 好事一 : MATLAB 在今年上半年的更新後,迫使MKL在使用 3rd Gen Ryzen 也會啟用 AVX2 : 好事二 : 除了 MKL,還有個類似的OpenBLAS也很快 : 這裡有人有進行比較 Link: https://bit.ly/33PUOpl : https://i.imgur.com/95dF2WC.jpg
OpenBLAS 記得是基於 GotoBLAS 開發出來的 主要維護者是對岸的人 這版的 BLAS 它是把全部的 subroutine 對照 cpu都用 SIMD指令去處理 等於是硬幹 速度幾乎跟 Intel MKL一樣 目前還有一個 ATLAS => auto tuned blas 它是用程式自己去調整的 算是各有千秋 另外用MKL單獨去比 BLAS subroutine也不公平 BLAS 最複雜的 level 3 也只是 D = A*B + C 依照Intel的網站所講 它是在否些演算法上 使用平行運算 MKL 最主用的library就是 LAPACK LAPACK其中的 Cholesky decomposition 本身就可以平行運算 至於求 SVD 使用 Householder reflector 也是可以使用平行運算 QR decomposition 也可以用 Householder reflector 還有LAPACK的 chetrd (reduce Hermitian matrix to tridiagonal form) 也是可以平行運算 LAPACK 很多演算法 都是要高手才知道細節的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.124.167.178 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1600853883.A.40C.html

09/23 17:42, 5年前 , 1F
樓下說說看
09/23 17:42, 1F

09/23 17:47, 5年前 , 2F
你不要這麼專業好不好
09/23 17:47, 2F

09/23 17:53, 5年前 , 3F
快推 免得被人發現我看不懂
09/23 17:53, 3F

09/23 18:09, 5年前 , 4F
請問可以有簡單結論嗎
09/23 18:09, 4F

09/23 18:09, 5年前 , 5F
嗯嗯,和我想到一樣
09/23 18:09, 5F

09/23 18:23, 5年前 , 6F
說正常人聽的懂的話好嗎
09/23 18:23, 6F
文章代碼(AID): #1VQnTxGC (Gossiping)
討論串 (同標題文章)
文章代碼(AID): #1VQnTxGC (Gossiping)