[解題] CUDA C 程式速度優化消失
1.對象: 男
2.地點: ←(請注意自身安全、財物等。)
3.科目:CUDA C
4.上課時間:
5.薪水:一次2500(大概只有一次,確定work立馬給)
6.條件:教我怎麼做或是幫我做使我的Monte carlo演算法可以跑的更快。
7.聯絡方式:站內信
8.附註:我所有kernel都寫完了,也有利用blockDim※blockIdx等錯開方式優化過kernel
。
目前我想讓60種不同參數的同個演算法跑的更快,每一種參數依序跑太慢了,不知到有沒
有更快的方式可以一起下去跑,進而節省時間。
我是交大的學生,可以現場教我,或是網路教學,這些都可以。
-----------------------------------------
目前程式碼:
for(i=0;i<100000;i++)
{
kernel1()
cudaDeviceSynchronize();
kernel2() <--會用到kernel1算出來的值
cudaDeviceSynchronize();
kernel3() <--會用到kernel2算出來的值
cudaDeviceSynchronize()
kernel4() <--會用到kernel3算出來的值
cudaDeviceSynchronize()
}
感謝。
9.補習班名稱:
提醒:所張貼文章須符合法令所規範的薪資報酬,且不得限制性別等規定。
如違反將按照板規處分。
----
如使用者對於本篇文章想回覆者,請記得按M,回覆至作者信箱
誤發至板上三天內有權自行刪除一次,再犯者水桶兩週。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.199.227
※ 文章網址: https://www.ptt.cc/bbs/HomeTeach/M.1527103902.A.893.html
→
05/24 03:48, , 1F
05/24 03:48, 1F
※ 編輯: FermiDirac (49.216.199.227), 05/24/2018 03:56:32