Re: [問題] 將平行處理的CUDA和MPI做結合

看板C_and_CPP作者 (滄海無限 我的船渺小)時間12年前 (2013/01/04 15:43), 編輯推噓0(002)
留言2則, 2人參與, 最新討論串3/3 (看更多)
各位版友好: 小弟最近正在學cuda,我想請教我們實驗室有兩張卡(C2050) 如果程式由CPU直接分data給兩張GPU同時執行(我知道GPU之間 的資料交流是要用MPI,還是有什麼方法?),但如果我的程式 比如說先產生1~256*256個亂數,然後每個亂數疊代100次 假設D是device上的變數, D(x)=sin(D(x)) => 100次 我是否可以將1~32768 傳送給GPU1做疊代,32769~256*256給GPU2做疊代 而且是同時傳送,同時運算,整個運算的時間是跟一個GPU運算的差不多呢? 我有參考http://ppt.cc/WEF~ 第82頁的做法 istat = cudaSetDevice(0) ...... istat = cudaSetDevice(1) ..... 但運算時間是單一GPU運算的兩倍.... 不平行 = = -- -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 182.155.14.216 noahsark430:轉錄至看板 Fortran 01/04 23:44

01/05 00:05, , 1F
power 夠力的話插在同一台主機上 然後參考cuda openmp範例
01/05 00:05, 1F

01/06 10:48, , 2F
量一下時間是不是都花在搬資料了。
01/06 10:48, 2F
文章代碼(AID): #1GvlYnnr (C_and_CPP)
文章代碼(AID): #1GvlYnnr (C_and_CPP)