討論串[問題] CUDA 程式
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓7(7推 0噓 14→)留言21則,0人參與, 11月前最新作者goodzey (--)時間11月前 (2023/05/18 23:38), 編輯資訊
1
0
0
內容預覽:
不知道有沒有高手可以解答以下問題?. 資料形式: 600列800行的隨機數. 目的: 把每一行的數據加起來. 初始化:. sum[600]={0.0}. data[600x800]= 上述資料. CUDA程式1: 成功. // dim3 gridsize(1, 1, 1);. // dim3 blo
(還有422個字)

推噓2(2推 0噓 3→)留言5則,0人參與, 11月前最新作者Serge45 (QAQ)時間11月前 (2023/05/29 14:13), 編輯資訊
0
0
1
內容預覽:
這邊有一個簡單的最佳化,先把 tdx thread 負責的 row 之和放在 register. 裡面,這樣可以減少一些不必要的 global memory write。2 的話,每個 block 的 tdx thread 都會往 sum[tdx] 做加總,而 blocks 並沒有保證. 結束的時間
(還有2872個字)
首頁
上一頁
1
下一頁
尾頁