作者 a5000ml 在 PTT [ C_and_CPP ] 看板的留言(推文), 共32則

Re: [問題] CUDA中如何產生亂數？

[ C_and_CPP ]3 留言, 推噓總分: +1

作者: a5000ml - 發表於 2009/03/17 23:16(17年前)

1^F→a5000ml:搜尋 parallelrandom number GPU 其實還蠻多 paper 的03/17 23:21

2^F→a5000ml:像是 http://gpgpgpu.com/papers/EC0215.pdf03/17 23:22

[分享] CUDA 程式設計(15) -- 翻譯 RWT P4 [CU …

[ C_and_CPP ]2 留言, 推噓總分: +1

作者: a5000ml - 發表於 2009/01/30 16:32(17年前)

2^F→a5000ml:可以啊,我有用過,之前就是用它來鎖定 C 和 ptx 的對應~02/01 21:37

[分享] CUDA 程式設計(13) -- 材質快取 (一)

[ C_and_CPP ]3 留言, 推噓總分: +2

作者: a5000ml - 發表於 2008/12/11 01:47(17年前)

3^F→a5000ml:CUDA 還是通用, 畢竟 DX11 只是繪圖12/13 01:41

[分享] CUDA 程式設計(11) -- 速成篇(中)

[ C_and_CPP ]8 留言, 推噓總分: +3

作者: a5000ml - 發表於 2008/11/20 02:30(17年前)

3^F→a5000ml:目前來看是這樣的, 而且多執行緒交換資料要保証時序,11/20 22:51

4^F→a5000ml:必需要 synchronize, 所以要結束 kernel 再 invoke 一次,11/20 22:53

5^F→a5000ml:因為 multiprocessors 有限, 不同的 block 不見得同時執行11/20 22:54

6^F→a5000ml:CUDA 的 sync 就只有兩個指令, 實再變不出什麼花樣來~~XD11/20 22:56

[情報] 發現簡體中文 CUDA 手冊

[ C_and_CPP ]12 留言, 推噓總分: +2

作者: a5000ml - 發表於 2008/11/17 13:57(17年前)

3^F→a5000ml:我也很好奇 CSDN 怎麼解釋, 本來以為像 MSDN 一樣~~ XD11/18 10:17

4^F→a5000ml:傳二維陣列有很多方法, 可以先 typedef 陣列型別,11/18 10:20

5^F→a5000ml:再轉參數型態, 例如 typedef int IntA[100];11/18 10:21

6^F→a5000ml:__global__ void kernel(IntA* www,int n){...}11/18 10:21

7^F→a5000ml:void* qqq; cudaMalloc(&qqq, size);11/18 10:23

8^F→a5000ml:kernel<<<GRID,BLOCK>>>((IntA*)qqq,num);11/18 10:24

9^F→a5000ml:或者把 2D 打平 1D 的陣列, 到 kernel 中再定址11/18 10:27

10^F→a5000ml:A[y][x] <----> B[NX*y+x]11/18 10:28

11^F→a5000ml:又或者使用 struct 來傳陣列物件... 等等11/18 10:30

[分享] CUDA 程式設計(10) -- 速成篇(上)

[ C_and_CPP ]3 留言, 推噓總分: +2

作者: a5000ml - 發表於 2008/11/12 23:10(17年前)

4^F→a5000ml:其實我也沒錢買新電腦, 現在都用別人的~~ XDD11/14 21:10

[情報] 國網 CUDA 中文教學「線上版」出現了

[ C_and_CPP ]11 留言, 推噓總分: +6

作者: a5000ml - 發表於 2008/11/10 22:52(17年前)

5^F→a5000ml:我試過講義下載和影片都ok啊 QQ你有登入會員嗎?11/11 08:41

6^F→a5000ml:還是你桌上的 Windows 是用一般使用者帳號, 這好像影片11/11 08:43

7^F→a5000ml:會有點問題11/11 08:44

[分享] CUDA 程式設計(9) -- 泡泡龍 part 2

[ C_and_CPP ]3 留言, 推噓總分: +2

作者: a5000ml - 發表於 2008/11/06 03:11(17年前)

3^F→a5000ml:嗯, 我也覺得應該可以, 問題在於 BLOCK 中怎麼最佳化11/20 23:09

[分享] CUDA 程式設計(3) -- CUDA 安裝

[ C_and_CPP ]0 留言, 推噓總分: 0

作者: a5000ml - 發表於 2008/10/15 21:00(17年前)

2^F→a5000ml:Windows 下可以把 driver 執行檔用 rar 解壓縮, 看裡面10/08 23:06

3^F→a5000ml:有個 nv4_disp.inf 的安裝 profile 裡面的程序有安裝10/08 23:07

4^F→a5000ml:nvcuda.dll, 所以顯示卡 driver 就包含 cuda 了10/08 23:09

5^F→a5000ml:而 Linux 下的 Xserver 是確定不同, 因為以前有當機過10/08 23:13

[分享] CUDA 程式設計(2) -- SIMT概觀

[ C_and_CPP ]2 留言, 推噓總分: +2

作者: a5000ml - 發表於 2008/10/15 20:59(17年前)

32^F→a5000ml:warp 之後會介紹哦, 它和硬體組成有關, 是 32 threads10/04 11:50

33^F→a5000ml:並起來執行的單位, 用 8 個執行單元管線以 4 個週期執行10/04 11:52

34^F→a5000ml:所以達成平均 1 個週期 1 個指令的效果10/04 11:53

35^F→a5000ml:至於範例後面就會有, 因為現在只是剛開始而己, 介紹的10/04 11:55

36^F→a5000ml:比較傾向於概念部份, 等寫完安裝部份後, 開始進入10/04 11:57

37^F→a5000ml:寫程式的正題, 就會有很多範例 =^.^=10/04 11:58

作者查詢 / a5000ml