作者查詢 / lgen7604

總覽項目: 發文 | 留言 | 暱稱
作者 lgen7604 在 PTT [ C_and_CPP ] 看板的留言(推文), 共116則
限定看板:C_and_CPP
[問題] cuda 編譯錯誤問題
[ C_and_CPP ]5 留言, 推噓總分: +2
作者: deepking - 發表於 2010/03/03 21:02(16年前)
1Flgen7604:你並沒有把所有的double都改完 請把smooth_global和03/03 22:02
2Flgen7604:smooth_shared內的0.25都改為0.25f03/03 22:02
3Flgen7604:還有message的line73指的是.ptx檔 不是.cu檔03/03 22:05
Re: [問題] 如何設定CUDA的雙精準浮點數
[ C_and_CPP ]3 留言, 推噓總分: +2
作者: aada - 發表於 2010/03/03 01:49(16年前)
1Flgen7604:嗯 的確是符合條件03/03 02:04
3Flgen7604:你看看設定跟我寫的有沒有一樣?03/03 02:44
Re: [問題] 使用CUDA來擷取矩陣中部分值
[ C_and_CPP ]15 留言, 推噓總分: 0
作者: lgen7604 - 發表於 2010/02/24 02:01(16年前)
15Flgen7604:input矩陣是512*512還算親切的大小 (511可以分解為73*7)02/24 07:10
16Flgen7604:如果是510*510該怎麼處理才好? 像這種case就是做參數化時02/24 07:13
17Flgen7604:要特別注意的地方了02/24 07:14
20Flgen7604:寫code的想法這個問題 我只能說...經驗吧 看得多想得多02/25 01:35
21Flgen7604:碰到問題的時候想法自然就會出來了02/25 01:35
22Flgen7604:寫CUDA要特別注意的就是parallel的觀念了 和一般寫C或C++02/25 01:36
23Flgen7604:不一樣 要考慮如何把問題分割給很多的block和thread處理02/25 01:36
24Flgen7604:還有每個block和thread該負責什麼部份 特別是參數化時 要02/25 01:36
25Flgen7604:注意矩陣的dimension 還有boundary的問題02/25 01:37
26Flgen7604:如果要考慮performance那問題就多了= = 建議可以看看02/25 01:48
27Flgen7604:nVIDIA官方的CUDA programming guide 應該會有幫助的02/25 01:49
[問題] 使用CUDA來擷取矩陣中部分值
[ C_and_CPP ]10 留言, 推噓總分: +3
作者: aada - 發表於 2010/02/21 17:43(16年前)
1Flgen7604:device上的code是不能用malloc的02/21 19:04
3Flgen7604:先在host把空間malloc好 再呼叫CUDA搬移矩陣02/21 20:09
6Flgen7604:因為device不能使用malloc 所以A,B,C都由host做malloc02/21 20:20
7Flgen7604:之後的矩陣搬移才交給CDUA處理02/21 20:20
[問題] CUDA FFTSHIFT 如何修改
[ C_and_CPP ]1 留言, 推噓總分: +1
作者: aada - 發表於 2010/02/20 15:25(16年前)
1Flgen7604:光看這段看不出有什麼問題 我猜大概是跟dimension有關02/21 20:24
[問題] CUDA bitonic 輸入陣列無法排序
[ C_and_CPP ]1 留言, 推噓總分: 0
作者: aada - 發表於 2010/02/08 22:21(16年前)
1Flgen7604:沒有bitonic_kernel.cu沒辦法幫你測試啊02/10 21:35
Re: [問題] CUDA CUFFT對二維矩陣執行單x軸或y軸的 …
[ C_and_CPP ]5 留言, 推噓總分: +1
作者: lgen7604 - 發表於 2010/01/31 20:13(16年前)
4Flgen7604:其實結果用4x3的矩陣就存得下了 只是處理起來會比較麻煩02/01 14:23
5Flgen7604:如果想要方便處理的話 就轉換到4x4的矩陣吧02/01 14:24
[情報] CUDA書籍(日文)
[ C_and_CPP ]1 留言, 推噓總分: +1
作者: RisingForce - 發表於 2010/01/18 01:24(16年前)
1Flgen7604:GJ 大推 (limits.h是定義變數特性的header,可參考wiki)01/18 02:56
Re: [問題] CUDA CUFFT fft要如何shift?
[ C_and_CPP ]10 留言, 推噓總分: +3
作者: lgen7604 - 發表於 2010/01/10 00:58(16年前)
6Flgen7604:exp(1000i)的問題 andyjy12大已經解了 至於3x3的矩陣01/10 12:50
7Flgen7604:a[0][0] a[0][1] a[0][2] 把a[0][0]和a[2][2]交換01/10 12:50
8Flgen7604:a[1][0] a[1][1] a[1][2] 把a[0][2]和a[2][0]交換01/10 12:50
9Flgen7604:a[2][0] a[2][1] a[2][2] 就可以了01/10 12:50
[問題] CUDA CUFFT fft要如何shift?
[ C_and_CPP ]4 留言, 推噓總分: +2
作者: aada - 發表於 2010/01/10 00:13(16年前)
2Flgen7604:FFTW真的是很不錯 不過如果實驗常要做大量的DFT運算 而且01/10 13:16
3Flgen7604:GPU也支援CUDA的話 可以考慮看看CUFFT01/10 13:17
4Flgen7604:比較資料有一點舊 不過可以參考看看 http://0rz.com/dEqo01/10 13:17