[討論] CUDA 計算與記憶體位置問題
請問各位
我有數據資料
data A[60000]
data B[60000]
data C[60000]
data D[60000]
以上裡面有值而我把資料存在__device__中
然後宣告一個cudaMalloc陣列 testE[60000]
如果我需要計算
testE[idx] =((data A[idx]+dataC[idx]+dataD[idx])/dataB[idx]);
以上是我需要運算的過程跟資料量
如果我想改成利用shared memory來加速!!
因為數據過大,shared塞不下
想請問該怎麼做比較好?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 36.232.219.97
→
01/22 14:30, , 1F
01/22 14:30, 1F
→
01/22 14:34, , 2F
01/22 14:34, 2F
→
01/22 14:53, , 3F
01/22 14:53, 3F
→
01/22 16:15, , 4F
01/22 16:15, 4F
→
01/22 17:21, , 5F
01/22 17:21, 5F
→
01/22 22:07, , 6F
01/22 22:07, 6F
→
01/22 22:37, , 7F
01/22 22:37, 7F
→
01/23 08:41, , 8F
01/23 08:41, 8F
→
01/23 13:53, , 9F
01/23 13:53, 9F
→
01/25 09:10, , 10F
01/25 09:10, 10F