CUDA Matlab plug-in: AccelerEyes' Jacket已回收

看板MATLAB作者 (MSA-0011[Bst]PLAN303E)時間15年前 (2009/05/19 00:03), 編輯推噓2(204)
留言6則, 2人參與, 最新討論串1/10 (看更多)
※ [本文轉錄自 PC_Shopping 看板] 作者: yeahbo (MSA-0011[Bst]PLAN303E) 看板: PC_Shopping 標題: Re: [閒聊] GTX285 vs SG03 時間: Sun May 17 23:21:30 2009 ※ 引述《yeahbo (MSA-0011[Bst]PLAN303E)》之銘言: : 雖然 SG03 這個小機殼標榜可以相容10.5"長卡 : 不過好像還沒有看過有哪個瘋子把 GTX285 塞進去過 : 因為一些機緣,在下做了這個瘋狂的嘗試 XD : 拿來與各位版友分享~~ : http://photo.xuite.net/yeahbo/420580/58.jpg
: 主角之一,ASUS GTX285 : http://photo.xuite.net/yeahbo/420580/59.jpg
: 背面照,有點模糊 : http://photo.xuite.net/yeahbo/420580/60.jpg
: 為了這張卡而買的POWER,賞心悅目的海盜船VX550W : http://photo.xuite.net/yeahbo/420580/37.jpg
: 另一個主角,SilverStone SG03 : http://photo.xuite.net/yeahbo/420580/62.jpg
: 內部照,因為她原來是我的動畫姬,所以已經有裝東西 : (5600+、M3A78-EM、DDR2 800 2G x1、梭十250GB、SONY V200A) : http://photo.xuite.net/yeahbo/420580/64.jpg
: GTX285 上機,還真的裝得進去(廢話) : http://photo.xuite.net/yeahbo/420580/65.jpg
: 從前面看 : http://photo.xuite.net/yeahbo/420580/67.jpg
: 為了散熱,前面板裝了兩顆12cm風扇,風扇跟顯卡之間幾乎沒有空隙 : 左邊的風扇是 SG03 原廠附的,因為有金屬網會卡到顯卡,所以需要避開顯卡 : http://photo.xuite.net/yeahbo/420580/68.jpg
: POWER上機,整線完畢,還蠻空的耶~~(?) : http://photo.xuite.net/yeahbo/420580/69.jpg
: 側面照,僅把用不到的線路塞到光碟機後方空間,盡量減少POWER前面那一把的量 : 心得:SG03 真的很難裝,也很難整線... : 至於性能測試,燒機,系統溫度之類的... 等我有空吧... Orz 來點性能小測試 既然是CUDA機,就來跑CUDA吧~~ XD 環境: Hardware:AMD AthlonX2 5600+ ASUS M3A78-EM 威剛DDR2 800 2G x1 ASUS GTX285 Seagate 梭魚十代 250GB SONY V200A Software:Windows XP 32bit SP3 VGA driver version: 185.85 CUDA 2.1 Matlab 2007b Matlab plug-in: AccelerEyes' Jacket 1.0.3 trial 用 5600+ 跟 GTX285 來 PK 二維方陣跟二維方陣的運算(+ - .* ./ *) 方陣大小從 2 x 2 到 2048 x 2048,每個 element 是介於0~1的亂數 每個運算都有執行十次作平均 GTX285 比 5600+ 快的倍數(橫軸是方陣大小) http://photo.xuite.net/yeahbo/420580/71.jpg
最大加速:2048 x 2048 的 ./ 運算加速了 1521 倍(5600+ 你死得好慘 XD) PS. 5600+ 只跑單核單執行緒,而且是 double 運算(我忘記測 single 的速度XD) GTX285 是跑 single 運算 Error 分析: http://photo.xuite.net/yeahbo/420580/70.jpg
相同的 single 運算,分別由 CPU 和 GPU 計算,然後跟 CPU 的 double 運算的結果 相減取絕對值,算出方陣每個 element 的平均誤差 + - .* 三種運算的誤差約在 10^-8,而且 CPU 和 GPU 的結果完全相同 ./ 運算的誤差較大,因為除法會放大數值誤差,這可以接受... 但是 CPU 和 GPU 的結果有差異(完了!<囧>) 雖然最大可加速 1500 倍,但是算不準就沒用了啊... Orz 最後,矩陣乘法部分因為運算量多很多,而且越大的矩陣每個 element 的運算量越大 所以越大的矩陣誤差越大是可預期的 但是 CPU 和 GPU 的結果比 ./ 差更多(大爆炸!<囧>) nVidia 你到底做了什麼? <囧> --- 這篇好像不太適合放這裡? XD -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.167.168.58

05/17 23:22,
所以 CUDA有用! 可是算不準?
05/17 23:22

05/17 23:27,
快推 XDD 讓我想到我不喜歡的統計學
05/17 23:27

05/17 23:27,
統計學專門的 大○○挺
05/17 23:27

05/17 23:27,
CUDA似乎在有支援的軟體下 差異很明顯
05/17 23:27

05/17 23:27,
室的小P大人
05/17 23:27

05/17 23:28,
大什麼大 人什麼人= =
05/17 23:28

05/17 23:29,
那小人!?
05/17 23:29

05/17 23:29,
Mem ok~ Man not ok~ XDD
05/17 23:29

05/17 23:29,
我叫大人阿
05/17 23:29

05/17 23:29,
RING~RING HELLO?
05/17 23:29

05/17 23:33,
鈴木 走 我們去糖果山!!
05/17 23:33

05/17 23:35,
洽卡恰卡恰卡恰卡恰卡恰卡 shoe~shoe~
05/17 23:35

05/17 23:35,
去枕頭山比較好
05/17 23:35

05/17 23:35,
喔 NO ~ 洽卡洽卡
05/17 23:35

05/17 23:46,
please stop bouncing on me
05/17 23:46

05/17 23:46,
XDD
05/17 23:46

05/17 23:48,
我才不相信有枕頭山這個鬼地方
05/17 23:48

05/17 23:48,
有喔 大P 洽卡洽卡
05/17 23:48

05/17 23:49,
http://www.ete.com.tw/play/ 不用懷疑 真的有
05/17 23:49

05/17 23:49,
suzukihiro! You are banana king!
05/17 23:49

05/17 23:50,
我不要進去後 出來發現我少顆腎
05/17 23:50

05/18 00:12,
印象中, CPU運算時的浮點暫存器是用到80bits的, 如果連
05/18 00:12

05/18 00:12,
續運算都在cpu浮點暫存器到最後才寫入mem, CPU的確可能
05/18 00:12

05/18 00:14,
會有過高(指高於float精度)的準確度; 這點可能是這個世
05/18 00:14

05/18 00:15,
代的GPU沒辦法相比的; 只是這要看對精確度的要求就是:)
05/18 00:15
-- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.167.168.58

05/19 01:37, , 1F
AccelerEyes' Jacket好像要錢?
05/19 01:37, 1F

05/19 01:42, , 2F
"相同的 single 運算,分別由 CPU 和 GPU 計算"
05/19 01:42, 2F

05/19 01:42, , 3F
cpu不是只跑了double?
05/19 01:42, 3F

05/19 13:21, , 4F
為了分析error的來源,有另外用CPU算single,只是沒有計時
05/19 13:21, 4F

05/19 13:22, , 5F
AccelerEyes' Jacket的確要錢,而且頗貴的,又沒有double
05/19 13:22, 5F

05/19 13:23, , 6F
我正在另尋他法中... XD
05/19 13:23, 6F
文章代碼(AID): #1A4OR48z (MATLAB)
討論串 (同標題文章)
以下文章回應了本文 (最舊先):
完整討論串 (本文為第 1 之 10 篇):
文章代碼(AID): #1A4OR48z (MATLAB)