作者查詢 / aada

總覽項目: 發文 | 留言 | 暱稱
作者 aada 在 PTT [ C_and_CPP ] 看板的留言(推文), 共136則
限定看板:C_and_CPP
Re: [問題] 使用CUDA來擷取矩陣中部分值
[ C_and_CPP ]1 留言, 推噓總分: 0
作者: lgen7604 - 發表於 2010/02/26 10:19(16年前)
1Faada:嗯, 我大致上了解了, 謝謝你02/28 00:15
Re: [問題] 使用CUDA來擷取矩陣中部分值
[ C_and_CPP ]15 留言, 推噓總分: 0
作者: lgen7604 - 發表於 2010/02/24 02:01(16年前)
1Faada:如果我今天矩陣是比較大的畫,如512*512
2Faada:dim3 blocks, threadsIM5好像就不可以這樣寫了,是嗎
3Faada:int bx = (NNx + BLOCK_SIZE - 1) / BLOCK_SIZE;
4Faada:dim3 blocks(bx, bx);
5Faada:dim3 threads(BLOCK_SIZE, BLOCK_SIZE);
6Faada:BLOCK_SIZE 我設為16
7Faada:我IM5大致上試出來了
8Faada:dim3 blocksIM5( 16, 73);
9Faada:dim3 threadsIM5( 32, 7 );
10Faada:movaIM5<<<blocksIM5, threadsIM5>>>( d_input, d_IM5 );
11Faada:這樣剛好處理(16*32=512, 73*7=511) --> 512*511的矩陣
12Faada:我這樣寫的方式OK嗎,有什麼地方可以改進的
13Faada:我那樣設定是為了我只是取512*511的矩陣,所以將block,threds02/24 02:26
14Faada:設為那樣, 如果矩陣不一樣的話,就得改了02/24 02:27
18Faada:謝謝你, 想請教你一個觀念問題, 你怎麼想出來是用if來寫呢,02/24 14:17
19Faada:以及寫CUDA時您是怎麼來思考的, 我對CUDA的經驗還沒有很深.02/24 14:19
Re: [問題] 使用CUDA來擷取矩陣中部分值
[ C_and_CPP ]12 留言, 推噓總分: +1
作者: lgen7604 - 發表於 2010/02/23 10:09(16年前)
1Faada:如果我今天矩陣是比較大的畫,如512*51202/23 12:08
2Faada:dim3 blocks, threadsIM5好像就不可以這樣寫了,是嗎02/23 12:10
3Faada:int bx = (NNx + BLOCK_SIZE - 1) / BLOCK_SIZE;02/23 12:20
4Faada:dim3 blocks(bx, bx);02/23 12:20
5Faada:dim3 threads(BLOCK_SIZE, BLOCK_SIZE);02/23 12:21
6Faada:BLOCK_SIZE 我設為1602/23 12:21
7Faada:我IM5大致上試出來了02/23 22:22
8Faada:dim3 blocksIM5( 16, 73);02/23 22:23
9Faada:dim3 threadsIM5( 32, 7 );02/23 22:23
10Faada:movaIM5<<<blocksIM5, threadsIM5>>>( d_input, d_IM5 );02/23 22:23
11Faada:這樣剛好處理(16*32=512, 73*7=511) --> 512*511的矩陣02/23 22:25
12Faada:我這樣寫的方式OK嗎,有什麼地方可以改進的02/23 22:25
Re: [問題] 使用CUDA來擷取矩陣中部分值
[ C_and_CPP ]7 留言, 推噓總分: 0
作者: lgen7604 - 發表於 2010/02/21 20:57(16年前)
1Faada:謝謝你,我試試看02/21 21:30
2Faada:我的kernel程式如下面,就可以產生矩陣B了,02/21 23:55
3Faada:__global__ void movaIM11(float *input1, float *output1)02/21 23:55
4Faada:{ int col = blockIdx.x*blockDim.x+threadIdx.x;02/21 23:55
5Faada:int row = blockIdx.y*blockDim.x+threadIdx.y;02/21 23:55
6Faada:output1[row*NNx+col] = input1[row*NNx+col];02/21 23:56
7Faada:}02/21 23:56
[問題] 使用CUDA來擷取矩陣中部分值
[ C_and_CPP ]10 留言, 推噓總分: +3
作者: aada - 發表於 2010/02/21 17:43(16年前)
2Faada:嗯嗯, 我是想說是否有辦法使用CUDA來完成上面的程式02/21 19:25
4Faada:我目前是在host上molloc好矩陣A,然後由CUDA來處理矩陣B02/21 20:12
5Faada:我要如何在kernel中來表示搬移的寫法02/21 20:14
8Faada:嗯嗯,我都是在host上malloc,搬移給CUDA處理02/21 20:25
9Faada:至於搬移的動作, kernel應該要怎麼來寫, 目前上面的kernel02/21 20:26
10Faada:是把全部都般鍋去02/21 20:26
Re: [問題] CUDA CUFFT對二維矩陣執行單x軸或y軸的 …
[ C_and_CPP ]5 留言, 推噓總分: +1
作者: lgen7604 - 發表於 2010/01/31 20:13(16年前)
2Faada:謝謝大大, 假設我今天要對FFT後的數據處理的話,我是不是要再02/01 11:12
3Faada:另外創造一個4x4的矩陣,將FFT後的值傳入到新的矩陣呢02/01 11:13
[問題] CUDA CUFFT對二維矩陣執行單x軸或y軸的傅立葉轉換
[ C_and_CPP ]2 留言, 推噓總分: 0
作者: aada - 發表於 2010/01/29 23:08(16年前)
2Faada:謝謝您01/30 02:28
[問題] OpenCV CCD&Webcom疑問
[ C_and_CPP ]4 留言, 推噓總分: +2
作者: aada - 發表於 2010/01/26 11:12(16年前)
2Faada:您的意思是?01/27 13:01
[問題] CUDA 警告:subscript out of range
[ C_and_CPP ]10 留言, 推噓總分: +1
作者: aada - 發表於 2010/01/18 15:36(16年前)
2Faada:你好,這個警告i,j的位置沒有關係~01/18 15:48
4Faada:但是為什麼我在c上面,也是yy[qqx][qqy],但編譯沒有顯示警告呢01/18 16:07
8Faada:請問我不使用return的畫還有其他方法傳回來嗎?thx01/18 23:11
10Faada:這只是我程式的一部分,因為主要出線的警告在這,就PO這了01/19 00:46
Re: [問題] CUDA CUFFT fft要如何shift?
[ C_and_CPP ]10 留言, 推噓總分: +3
作者: lgen7604 - 發表於 2010/01/10 00:58(16年前)
1Faada:假如說今天只是3x3的矩陣,要怎麼分四個象限呢,謝謝01/10 02:09
2Faada:請問一下,我想對虛數(值=1000)部分做exp,01/10 03:04
3Faada:exp(a[0][0].y)=無限大, 要怎麼才可以做出exp(1000i)呢01/10 03:04
10Faada:謝謝你們01/10 13:05