作者查詢 / lgen7604

總覽項目：發文 | 留言 | 暱稱

作者 lgen7604 在 PTT [ C_and_CPP ] 看板的留言(推文), 共116則

限定看板：C_and_CPP

看板排序：

全部C_and_CPP116Perl27Tech_Job17Modchip4PSP-PSV4MATLAB3RDSS2CSMU-SG1FuMouDiscuss1HardwareSale1KS_PMAC1MUSTMIS1NTHU-MSE091NTUCE-961NTUT_en489b1YH33rd3191YP91-3111<< 收起看板(17)

首頁

尾頁

[問題] cuda 編譯錯誤問題

[ C_and_CPP ]5 留言, 推噓總分: +2

作者: deepking - 發表於 2010/03/03 21:02(16年前)

1^F推lgen7604:你並沒有把所有的double都改完請把smooth_global和03/03 22:02

2^F→lgen7604:smooth_shared內的0.25都改為0.25f03/03 22:02

3^F推lgen7604:還有message的line73指的是.ptx檔不是.cu檔03/03 22:05

Re: [問題] 如何設定CUDA的雙精準浮點數

[ C_and_CPP ]3 留言, 推噓總分: +2

作者: aada - 發表於 2010/03/03 01:49(16年前)

1^F推lgen7604:嗯的確是符合條件03/03 02:04

3^F推lgen7604:你看看設定跟我寫的有沒有一樣?03/03 02:44

Re: [問題] 使用CUDA來擷取矩陣中部分值

[ C_and_CPP ]15 留言, 推噓總分: 0

作者: lgen7604 - 發表於 2010/02/24 02:01(16年前)

15^F→lgen7604:input矩陣是512*512還算親切的大小 (511可以分解為73*7)02/24 07:10

16^F→lgen7604:如果是510*510該怎麼處理才好? 像這種case就是做參數化時02/24 07:13

17^F→lgen7604:要特別注意的地方了02/24 07:14

20^F→lgen7604:寫code的想法這個問題我只能說...經驗吧看得多想得多02/25 01:35

21^F→lgen7604:碰到問題的時候想法自然就會出來了02/25 01:35

22^F→lgen7604:寫CUDA要特別注意的就是parallel的觀念了和一般寫C或C++02/25 01:36

23^F→lgen7604:不一樣要考慮如何把問題分割給很多的block和thread處理02/25 01:36

24^F→lgen7604:還有每個block和thread該負責什麼部份特別是參數化時要02/25 01:36

25^F→lgen7604:注意矩陣的dimension 還有boundary的問題02/25 01:37

26^F→lgen7604:如果要考慮performance那問題就多了= = 建議可以看看02/25 01:48

27^F→lgen7604:nVIDIA官方的CUDA programming guide 應該會有幫助的02/25 01:49

[問題] 使用CUDA來擷取矩陣中部分值

[ C_and_CPP ]10 留言, 推噓總分: +3

作者: aada - 發表於 2010/02/21 17:43(16年前)

1^F推lgen7604:device上的code是不能用malloc的02/21 19:04

3^F推lgen7604:先在host把空間malloc好再呼叫CUDA搬移矩陣02/21 20:09

6^F推lgen7604:因為device不能使用malloc 所以A,B,C都由host做malloc02/21 20:20

7^F→lgen7604:之後的矩陣搬移才交給CDUA處理02/21 20:20

[問題] CUDA FFTSHIFT 如何修改

[ C_and_CPP ]1 留言, 推噓總分: +1

作者: aada - 發表於 2010/02/20 15:25(16年前)

1^F推lgen7604:光看這段看不出有什麼問題我猜大概是跟dimension有關02/21 20:24

[問題] CUDA bitonic 輸入陣列無法排序

[ C_and_CPP ]1 留言, 推噓總分: 0

作者: aada - 發表於 2010/02/08 22:21(16年前)

1^F→lgen7604:沒有bitonic_kernel.cu沒辦法幫你測試啊02/10 21:35

Re: [問題] CUDA CUFFT對二維矩陣執行單x軸或y軸的 …

[ C_and_CPP ]5 留言, 推噓總分: +1

作者: lgen7604 - 發表於 2010/01/31 20:13(16年前)

4^F→lgen7604:其實結果用4x3的矩陣就存得下了只是處理起來會比較麻煩02/01 14:23

5^F→lgen7604:如果想要方便處理的話就轉換到4x4的矩陣吧02/01 14:24

[情報] CUDA書籍(日文)

[ C_and_CPP ]1 留言, 推噓總分: +1

作者: RisingForce - 發表於 2010/01/18 01:24(16年前)

1^F推lgen7604:GJ 大推 (limits.h是定義變數特性的header,可參考wiki)01/18 02:56

Re: [問題] CUDA CUFFT fft要如何shift?

[ C_and_CPP ]10 留言, 推噓總分: +3

作者: lgen7604 - 發表於 2010/01/10 00:58(16年前)

6^F→lgen7604:exp(1000i)的問題 andyjy12大已經解了至於3x3的矩陣01/10 12:50

7^F→lgen7604:a[0][0] a[0][1] a[0][2] 把a[0][0]和a[2][2]交換01/10 12:50

8^F→lgen7604:a[1][0] a[1][1] a[1][2] 把a[0][2]和a[2][0]交換01/10 12:50

9^F→lgen7604:a[2][0] a[2][1] a[2][2] 就可以了01/10 12:50

[問題] CUDA CUFFT fft要如何shift?

[ C_and_CPP ]4 留言, 推噓總分: +2

作者: aada - 發表於 2010/01/10 00:13(16年前)

2^F推lgen7604:FFTW真的是很不錯不過如果實驗常要做大量的DFT運算而且01/10 13:16

3^F→lgen7604:GPU也支援CUDA的話可以考慮看看CUFFT01/10 13:17

4^F→lgen7604:比較資料有一點舊不過可以參考看看 http://0rz.com/dEqo01/10 13:17

首頁

尾頁