[解題] CUDA C 程式速度優化消失

看板HomeTeach作者時間6年前 (2018/05/24 03:31), 6年前編輯推噓0(001)
留言1則, 1人參與, 最新討論串1/1
1.對象: 男 2.地點: ←(請注意自身安全、財物等。) 3.科目:CUDA C 4.上課時間: 5.薪水:一次2500(大概只有一次,確定work立馬給) 6.條件:教我怎麼做或是幫我做使我的Monte carlo演算法可以跑的更快。 7.聯絡方式:站內信 8.附註:我所有kernel都寫完了,也有利用blockDim※blockIdx等錯開方式優化過kernel 。 目前我想讓60種不同參數的同個演算法跑的更快,每一種參數依序跑太慢了,不知到有沒 有更快的方式可以一起下去跑,進而節省時間。 我是交大的學生,可以現場教我,或是網路教學,這些都可以。 ----------------------------------------- 目前程式碼: for(i=0;i<100000;i++) { kernel1() cudaDeviceSynchronize(); kernel2() <--會用到kernel1算出來的值 cudaDeviceSynchronize(); kernel3() <--會用到kernel2算出來的值 cudaDeviceSynchronize() kernel4() <--會用到kernel3算出來的值 cudaDeviceSynchronize() } 感謝。 9.補習班名稱: 提醒:所張貼文章須符合法令所規範的薪資報酬,且不得限制性別等規定。 如違反將按照板規處分。 ---- 如使用者對於本篇文章想回覆者,請記得按M,回覆至作者信箱 誤發至板上三天內有權自行刪除一次,再犯者水桶兩週。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.199.227 ※ 文章網址: https://www.ptt.cc/bbs/HomeTeach/M.1527103902.A.893.html

05/24 03:48, , 1F
server. 是tesla. k80
05/24 03:48, 1F
※ 編輯: FermiDirac (49.216.199.227), 05/24/2018 03:56:32
文章代碼(AID): #1R1S6UYJ (HomeTeach)