[問題] CUDA的加速分析
看了網路上很多CUDA的範例,
有很多範例都是用了幾千個以上的THREAD然後最佳化之後得到幾十倍或頂多幾百的加速,
我知道不可能用一千條THREAD就達到一千的加速,
但是想請教一下有沒有辦法用分析的方式大概估出實作上有可能達到的最大加速?
還有一個問題,假如使用CUDA時~把資料存放在global memory
那從cuda的global memory取資料和從CPU直接從memory中取資料大概會差多少倍呢?
謝謝各位高手
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 111.251.208.92
推
02/24 15:56, , 1F
02/24 15:56, 1F
→
02/24 15:56, , 2F
02/24 15:56, 2F
→
02/24 15:57, , 3F
02/24 15:57, 3F
→
02/24 17:04, , 4F
02/24 17:04, 4F
→
02/24 17:05, , 5F
02/24 17:05, 5F
→
02/24 17:06, , 6F
02/24 17:06, 6F
推
02/24 18:16, , 7F
02/24 18:16, 7F
→
02/24 18:17, , 8F
02/24 18:17, 8F
→
02/24 18:18, , 9F
02/24 18:18, 9F
→
02/24 18:19, , 10F
02/24 18:19, 10F
→
02/24 18:21, , 11F
02/24 18:21, 11F
推
02/24 22:36, , 12F
02/24 22:36, 12F