作者查詢 / dulcet

總覽項目: 發文 | 留言 | 暱稱
作者 dulcet 在 PTT [ VideoCard ] 看板的留言(推文), 共11則
限定看板:VideoCard
首頁
上一頁
1
下一頁
尾頁
Re: [請益] 關於CUDA的bank conflict
[ VideoCard ]5 留言, 推噓總分: +2
作者: rick209 - 發表於 2009/06/18 17:39(16年前)
1Fdulcet:num1 和num2是在register, 不會conflict06/18 17:41
2Fdulcet:你一定在num1, num2前加了__shared__了 哪掉就OK06/18 17:42
4Fdulcet:@@ vector sum怎麼可能把register用完06/18 17:46
5Fdulcet:你可以把之前用過的register重複利用06/18 17:47
[請益] 關於CUDA的bank conflict
[ VideoCard ]9 留言, 推噓總分: +2
作者: rick209 - 發表於 2009/06/18 16:03(16年前)
1Fdulcet:看不懂你的舉例 你要做vector sum 還是 sum filter?06/18 17:14
2Fdulcet:vector sum 直接做不會有bank conflict06/18 17:16
3Fdulcet:sum filter用shared memory,thread個數開跟loading的個數06/18 17:20
4Fdulcet:一樣就不會global memory的bank conflict06/18 17:22
6Fdulcet:所以說是sum filter,那就用shared memory06/18 17:33
7Fdulcet:@@看錯是vector sum06/18 17:33
8Fdulcet:把for loop 幹掉 k=threadIdx.x 這樣才對吧?06/18 17:35
首頁
上一頁
1
下一頁
尾頁