[討論] 浮點數運算的效能與誤差

看板C_and_CPP作者 (CARD)時間8年前 (2017/10/08 04:12), 8年前編輯推噓8(8033)
留言41則, 14人參與, 8年前最新討論串1/1
各位好 各種不同 GPGPU 與 CPU 之間的浮點數運算 擁有很多不同的方式可以計算出不同精確度 例如 PhenomII 時代的 GPU 就已經是 GPGPU 可以透過 OpenCL 將大量 MIMD 交給 GPGPU 因此有些浮點數運算會 offload 到 GPGPU 一直以來不同 Device 有不同的浮點數誤差 但近期發現同 Device 多次運算卻不同結果 其實我只是想要寫個 GPGPU Benchmark 程式 http://cargon.net/GMEMD/GMEMD_GPU_Color_Real16bit_Benchmark.7z 但我發現每次交給 OpenCL 運算後有時出錯 也有可能是匯流排傳輸時發生錯誤導致誤差 因此我在比較的時候還重複比較反覆確認之 token=0; for(int j=0;j<t_height;++j){ for(int i=0;i<t_width;++i){ if( !( cvGetReal2D(fimg2_ch[0],j,i) == cvGetReal2D(fimg2_ch[1],j,i) && cvGetReal2D(fimg2_ch[2],j,i) == cvGetReal2D(fimg2_ch[0],j,i) && cvGetReal2D(fimg2_ch[1],j,i) == cvGetReal2D(fimg2_ch[2],j,i) ) ) token=1; if( !( cvGetReal2D(fimg2_ch[2],j,i) == cvGetReal2D(fimg2_ch[1],j,i) && cvGetReal2D(fimg2_ch[0],j,i) == cvGetReal2D(fimg2_ch[2],j,i) && cvGetReal2D(fimg2_ch[1],j,i) == cvGetReal2D(fimg2_ch[0],j,i) ) ) token=1; if( !( cvGetReal2D(fimg2_ch[1],j,i) == cvGetReal2D(fimg2_ch[2],j,i) && cvGetReal2D(fimg2_ch[2],j,i) == cvGetReal2D(fimg2_ch[0],j,i) && cvGetReal2D(fimg2_ch[0],j,i) == cvGetReal2D(fimg2_ch[1],j,i) ) ) token=1; } } printf("token=%d ",token); 因為輸入的影像是 Grayscale 所以在重複執行 OpenCL Kernel 三次的數值應該完全相同 但有時候 token 還是會被寫入 1,即代表 3 次相同浮點數運算有不同結果於記憶體存取 不知道大家看法如何? 這問題困擾了我很久! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.44.220 ※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1507407177.A.D71.html ※ 編輯: a34021501 (36.229.44.220), 10/08/2017 04:16:10

10/08 04:29, 8年前 , 1F
semaphore mutex atomic 自己選一個
10/08 04:29, 1F

10/08 10:34, 8年前 , 2F
同一行為什麼要跑三次
10/08 10:34, 2F

10/08 15:38, 8年前 , 3F
你先確認一下token寫入時的值
10/08 15:38, 3F

10/08 18:04, 8年前 , 4F
OpenCL 的同步是使用 barrier() 去研讀那部份的東西
10/08 18:04, 4F

10/08 18:05, 8年前 , 5F
簡單的觀念是不經過 barrier() 不該去撈別人負責的格子
10/08 18:05, 5F

10/09 04:27, 8年前 , 6F
barrier主要是擋CPU亂序,GPU....也能用嗎o_oa?
10/09 04:27, 6F

10/09 09:32, 8年前 , 7F
呃嗯, 我其實不太確定這邊是在問 kernel 運算本身
10/09 09:32, 7F

10/09 09:33, 8年前 , 8F
還是 host/device 的傳遞資料, 畢竟結果出錯的原因
10/09 09:33, 8F

10/09 09:33, 8年前 , 9F
這兩者其中之一出錯都有可能
10/09 09:33, 9F

10/09 09:33, 8年前 , 10F
我提的 barrier() 是 kernel code 裡的東西
10/09 09:33, 10F

10/09 09:33, 8年前 , 11F
主要是同一 Workgroup 內的各 Workitem 之間同步
10/09 09:33, 11F

10/09 09:34, 8年前 , 12F
這只單純是在講 device 端的 kernel 運算
10/09 09:34, 12F

10/09 13:26, 8年前 , 13F
a34 發文其實不用太認真看就是 XD
10/09 13:26, 13F

10/09 18:19, 8年前 , 14F
看到GPU OPENCL猜ID
10/09 18:19, 14F

10/09 22:38, 8年前 , 15F
其實 barrier 只在 GPGPU 中的某個 module 中等待同步!
10/09 22:38, 15F

10/09 22:39, 8年前 , 16F
所以軟體的 Workgroup 如何分配到 module 會有效能差異
10/09 22:39, 16F

10/09 22:40, 8年前 , 17F
其實這支程式在測試的時候發生不同步才會分兩階段Event
10/09 22:40, 17F

10/09 22:45, 8年前 , 18F
即等待 kernel function 結束才 read 或 next function
10/09 22:45, 18F

10/10 15:34, 8年前 , 19F
而這個測試採用的是太陽系內某些磁場的空間頻率分佈圖!
10/10 15:34, 19F

10/10 15:35, 8年前 , 20F
因此如果磁場在waffer上的頻率不太正常的話可能會出錯!
10/10 15:35, 20F

10/10 15:36, 8年前 , 21F
因為在 EnqueueBuffer 的時候會將整個影像以 bus 寬度~
10/10 15:36, 21F

10/10 15:37, 8年前 , 22F
傳送進 GPGPU 的 GlobalMemory (GDDR) 產生相應電磁波!
10/10 15:37, 22F

10/10 15:38, 8年前 , 23F
所以太陽系內如果磁場不太正常,就可能發生些許的錯誤~
10/10 15:38, 23F

10/10 15:38, 8年前 , 24F
哇嗚嗚新發現耶 快發paper!!!!
10/10 15:38, 24F

10/10 15:39, 8年前 , 25F
IEEE Trans on Electromagnetic Compatibility 等你
10/10 15:39, 25F

10/10 15:39, 8年前 , 26F
但是螢幕只有 16bit 色深的話其實根本看不出來錯在哪裡
10/10 15:39, 26F

10/10 15:42, 8年前 , 27F
你有紙筆對吧 算一下能量夠不夠啊 實驗做一下
10/10 15:42, 27F

10/10 15:44, 8年前 , 28F
我有認識這領域的 IEEE Editor 要不要幫你呢~嘻嘻
10/10 15:44, 28F

10/10 15:44, 8年前 , 29F
最近鐘擺都會被重力電磁場推動而產生非常不穩態的計時!
10/10 15:44, 29F

10/10 15:44, 8年前 , 30F
而且貴先生應該對這個領域很有研究 還發了很多篇呢
10/10 15:44, 30F

10/10 15:45, 8年前 , 31F
不止在我們版上發 還發到被水桶十年真是功績斐然
10/10 15:45, 31F

10/10 15:46, 8年前 , 32F
鐘擺哈哈鐘擺 你知道現在都用原子鐘嗎哈哈哈哈哈哈
10/10 15:46, 32F

10/10 15:50, 8年前 , 33F
原子鐘用能階釋放的微波訊號計時 會不會也有影響呢
10/10 15:50, 33F

10/10 15:50, 8年前 , 34F
不同計時器要確保每次同步累加避免對時錯誤而傳輸異常!
10/10 15:50, 34F

10/10 17:36, 8年前 , 35F
但也有可能是衛星或其他裝置使用超過IEEE的電磁規範...
10/10 17:36, 35F

10/16 19:21, 8年前 , 36F
難怪有不太舒服的熟悉感 :|
10/16 19:21, 36F

10/16 23:45, 8年前 , 37F
竟然鬧到這裡來了 = =
10/16 23:45, 37F

10/17 19:53, 8年前 , 38F
壓力大概很大?
10/17 19:53, 38F

10/17 21:31, 8年前 , 39F
已經不只是壓力大的程度了吧.....
10/17 21:31, 39F

10/17 21:49, 8年前 , 40F
我好像迷路了,這裡是Gundam版嗎...???
10/17 21:49, 40F

10/17 23:28, 8年前 , 41F
他到底要被多少個版水桶才不會發奇怪的文章阿
10/17 23:28, 41F
文章代碼(AID): #1PsJL9rn (C_and_CPP)