[發案]CUDA C 運算速度優化
發案人:男
聯絡方式1:站內信
聯絡方式2:
所在地區 :新竹或網路上
有效時間:之後1禮拜內
專案說明:我所有kernel都寫完了,也有利用blockDim※blockIdx等錯開方式優
化過kernel。
目前我想讓60種不同參數的同個演算法跑的更快,每一種參數依序跑太慢了,不知到有沒
有更快的方式可以一起下去跑,進而節省時間。
我是交大的學生,教我怎麼做或是幫我做使我的Monte carlo演算法可以跑的更快。
-----------------------------------------
目前程式碼
for(i=0;i<100000;i++)
{
kernel1()
cudaDeviceSynchronize();
kernel2() <--會用到kernel1算出來的值
cudaDeviceSynchronize();
kernel3() <--會用到kernel2算出來的值
cudaDeviceSynchronize()
kernel4() <--會用到kernel3算出來的值
cudaDeviceSynchronize()
}
預算:2500~3000
接案者要求:
附註:
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.199.227
※ 文章網址: https://www.ptt.cc/bbs/CodeJob/M.1527107747.A.C50.html
※ 編輯: FermiDirac (49.216.199.227), 05/24/2018 04:37:14
※ 編輯: FermiDirac (49.216.199.227), 05/24/2018 04:37:58
※ 編輯: FermiDirac (49.216.199.227), 05/24/2018 04:38:18
推
05/24 23:28,
7年前
, 1F
05/24 23:28, 1F