作者查詢 / a5000ml
作者 a5000ml 在 PTT [ C_and_CPP ] 看板的留言(推文), 共32則
限定看板:C_and_CPP
看板排序:
首頁
上一頁
1
下一頁
尾頁
1F→:搜尋 parallelrandom number GPU 其實還蠻多 paper 的03/17 23:21
2F→:像是 http://gpgpgpu.com/papers/EC0215.pdf03/17 23:22
2F→:可以啊,我有用過,之前就是用它來鎖定 C 和 ptx 的對應~02/01 21:37
3F→:CUDA 還是通用, 畢竟 DX11 只是繪圖12/13 01:41
3F→:目前來看是這樣的, 而且多執行緒交換資料要保証時序,11/20 22:51
4F→:必需要 synchronize, 所以要結束 kernel 再 invoke 一次,11/20 22:53
5F→:因為 multiprocessors 有限, 不同的 block 不見得同時執行11/20 22:54
6F→:CUDA 的 sync 就只有兩個指令, 實再變不出什麼花樣來~~XD11/20 22:56
3F→:我也很好奇 CSDN 怎麼解釋, 本來以為像 MSDN 一樣~~ XD11/18 10:17
4F→:傳二維陣列有很多方法, 可以先 typedef 陣列型別,11/18 10:20
5F→:再轉參數型態, 例如 typedef int IntA[100];11/18 10:21
6F→:__global__ void kernel(IntA* www,int n){...}11/18 10:21
7F→:void* qqq; cudaMalloc(&qqq, size);11/18 10:23
8F→:kernel<<<GRID,BLOCK>>>((IntA*)qqq,num);11/18 10:24
9F→:或者把 2D 打平 1D 的陣列, 到 kernel 中再定址11/18 10:27
10F→:A[y][x] <----> B[NX*y+x]11/18 10:28
11F→:又或者使用 struct 來傳陣列物件... 等等11/18 10:30
4F→:其實我也沒錢買新電腦, 現在都用別人的~~ XDD11/14 21:10
5F→:我試過講義下載和影片都ok啊 QQ你有登入會員嗎?11/11 08:41
6F→:還是你桌上的 Windows 是用一般使用者帳號, 這好像影片11/11 08:43
7F→:會有點問題11/11 08:44
3F→:嗯, 我也覺得應該可以, 問題在於 BLOCK 中怎麼最佳化11/20 23:09
2F→:Windows 下可以把 driver 執行檔用 rar 解壓縮, 看裡面10/08 23:06
3F→:有個 nv4_disp.inf 的安裝 profile 裡面的程序有安裝10/08 23:07
4F→:nvcuda.dll, 所以顯示卡 driver 就包含 cuda 了10/08 23:09
5F→:而 Linux 下的 Xserver 是確定不同, 因為以前有當機過10/08 23:13
32F→:warp 之後會介紹哦, 它和硬體組成有關, 是 32 threads10/04 11:50
33F→:並起來執行的單位, 用 8 個執行單元管線以 4 個週期執行10/04 11:52
34F→:所以達成平均 1 個週期 1 個指令的效果10/04 11:53
35F→:至於範例後面就會有, 因為現在只是剛開始而己, 介紹的10/04 11:55
36F→:比較傾向於概念部份, 等寫完安裝部份後, 開始進入10/04 11:57
37F→:寫程式的正題, 就會有很多範例 =^.^=10/04 11:58
首頁
上一頁
1
下一頁
尾頁