作者查詢 / aada

總覽項目：發文 | 留言 | 暱稱

作者 aada 在 PTT [ C_and_CPP ] 看板的留言(推文), 共136則

限定看板：C_and_CPP

看板排序：

全部C_and_CPP136MATLAB120LCD113SJU102RDSS78BigSanchung67Physics60Gossiping48PlayStation45Tech_Job41HsinChuang38MLBGAME34BabyMother30Web_Design27hair_loss21FixMyHouse20Master_D15Waa15graduate14NBAGAME14GTA13CMWang11creditcard10Japan_Travel10TY_Research8Electronics6Network6NFS6Windows6Wrestle6NBA5Nightmarket5Polytechnic5Aikido4Hualien4Notebook4PhD4TKU_TSPCB934Wen-Shan4Cad_Cae3Little-Games3Printer_scan3Spurs3VideoCard3Android2Bank_Service2CSMU-MT932CSSE2CTS2Daan2Database2Emulator2EZsoft2GIS2hardware2home-sale2KUAS2movie2NUU_ER2shoes2specialman2Steam2Stock2Tennis2WorldCup2Beauty1Broad_Band1BSB1Cavaliers1DragonBall1EatToDie1Ecophilia1Food1Free_box1Gamesale1Garena1Google1GreenParty1Hotel1HSNU_10551HSNU_10651Key_Mou_Pad1Linda1MMA1Moto_GP1MP96-2T1nb-shopping1NBA_Fantasy1NBALive1NCCU07_Ghis1NCUE1NDHU-ChBT1NDHU-His961NDMC-P921Nets1NKUTEE1NTHU_TM961Nuggets1PeopleSeries1Rubiks1SeoHee1SHAQ1Shu-Lin1ShuangHe1SongShan1SpaceArt1TKU-IE941TNFSH96101transgender1Uni-Service1UTAH-JAZZ1WuGu-BaLi1<< 收起看板(112)

首頁

尾頁

Re: [問題] 使用CUDA來擷取矩陣中部分值

[ C_and_CPP ]1 留言, 推噓總分: 0

作者: lgen7604 - 發表於 2010/02/26 10:19(16年前)

1^F→aada:嗯, 我大致上了解了, 謝謝你02/28 00:15

Re: [問題] 使用CUDA來擷取矩陣中部分值

[ C_and_CPP ]15 留言, 推噓總分: 0

作者: lgen7604 - 發表於 2010/02/24 02:01(16年前)

1^F→aada:如果我今天矩陣是比較大的畫,如512*512

2^F→aada:dim3 blocks, threadsIM5好像就不可以這樣寫了,是嗎

3^F→aada:int bx = (NNx + BLOCK_SIZE - 1) / BLOCK_SIZE;

4^F→aada:dim3 blocks(bx, bx);

5^F→aada:dim3 threads(BLOCK_SIZE, BLOCK_SIZE);

6^F→aada:BLOCK_SIZE 我設為16

7^F推aada:我IM5大致上試出來了

8^F→aada:dim3 blocksIM5( 16, 73);

9^F→aada:dim3 threadsIM5( 32, 7 );

10^F→aada:movaIM5<<<blocksIM5, threadsIM5>>>( d_input, d_IM5 );

11^F→aada:這樣剛好處理(16*32=512, 73*7=511) --> 512*511的矩陣

12^F→aada:我這樣寫的方式OK嗎,有什麼地方可以改進的

13^F→aada:我那樣設定是為了我只是取512*511的矩陣,所以將block,threds02/24 02:26

14^F→aada:設為那樣, 如果矩陣不一樣的話,就得改了02/24 02:27

18^F→aada:謝謝你, 想請教你一個觀念問題, 你怎麼想出來是用if來寫呢,02/24 14:17

19^F→aada:以及寫CUDA時您是怎麼來思考的, 我對CUDA的經驗還沒有很深.02/24 14:19

Re: [問題] 使用CUDA來擷取矩陣中部分值

[ C_and_CPP ]12 留言, 推噓總分: +1

作者: lgen7604 - 發表於 2010/02/23 10:09(16年前)

1^F→aada:如果我今天矩陣是比較大的畫,如512*51202/23 12:08

2^F→aada:dim3 blocks, threadsIM5好像就不可以這樣寫了,是嗎02/23 12:10

3^F→aada:int bx = (NNx + BLOCK_SIZE - 1) / BLOCK_SIZE;02/23 12:20

4^F→aada:dim3 blocks(bx, bx);02/23 12:20

5^F→aada:dim3 threads(BLOCK_SIZE, BLOCK_SIZE);02/23 12:21

6^F→aada:BLOCK_SIZE 我設為1602/23 12:21

7^F推aada:我IM5大致上試出來了02/23 22:22

8^F→aada:dim3 blocksIM5( 16, 73);02/23 22:23

9^F→aada:dim3 threadsIM5( 32, 7 );02/23 22:23

10^F→aada:movaIM5<<<blocksIM5, threadsIM5>>>( d_input, d_IM5 );02/23 22:23

11^F→aada:這樣剛好處理(16*32=512, 73*7=511) --> 512*511的矩陣02/23 22:25

12^F→aada:我這樣寫的方式OK嗎,有什麼地方可以改進的02/23 22:25

Re: [問題] 使用CUDA來擷取矩陣中部分值

[ C_and_CPP ]7 留言, 推噓總分: 0

作者: lgen7604 - 發表於 2010/02/21 20:57(16年前)

1^F→aada:謝謝你,我試試看02/21 21:30

2^F→aada:我的kernel程式如下面,就可以產生矩陣B了,02/21 23:55

3^F→aada:__global__ void movaIM11(float *input1, float *output1)02/21 23:55

4^F→aada:{ int col = blockIdx.x*blockDim.x+threadIdx.x;02/21 23:55

5^F→aada:int row = blockIdx.y*blockDim.x+threadIdx.y;02/21 23:55

6^F→aada:output1[row*NNx+col] = input1[row*NNx+col];02/21 23:56

7^F→aada:}02/21 23:56

[問題] 使用CUDA來擷取矩陣中部分值

[ C_and_CPP ]10 留言, 推噓總分: +3

作者: aada - 發表於 2010/02/21 17:43(16年前)

2^F→aada:嗯嗯, 我是想說是否有辦法使用CUDA來完成上面的程式02/21 19:25

4^F→aada:我目前是在host上molloc好矩陣A,然後由CUDA來處理矩陣B02/21 20:12

5^F→aada:我要如何在kernel中來表示搬移的寫法02/21 20:14

8^F→aada:嗯嗯,我都是在host上malloc,搬移給CUDA處理02/21 20:25

9^F→aada:至於搬移的動作, kernel應該要怎麼來寫, 目前上面的kernel02/21 20:26

10^F→aada:是把全部都般鍋去02/21 20:26

Re: [問題] CUDA CUFFT對二維矩陣執行單x軸或y軸的 …

[ C_and_CPP ]5 留言, 推噓總分: +1

作者: lgen7604 - 發表於 2010/01/31 20:13(16年前)

2^F推aada:謝謝大大, 假設我今天要對FFT後的數據處理的話,我是不是要再02/01 11:12

3^F→aada:另外創造一個4x4的矩陣,將FFT後的值傳入到新的矩陣呢02/01 11:13

[問題] CUDA CUFFT對二維矩陣執行單x軸或y軸的傅立葉轉換

[ C_and_CPP ]2 留言, 推噓總分: 0

作者: aada - 發表於 2010/01/29 23:08(16年前)

2^F→aada:謝謝您01/30 02:28

[問題] OpenCV CCD&Webcom疑問

[ C_and_CPP ]4 留言, 推噓總分: +2

作者: aada - 發表於 2010/01/26 11:12(16年前)

2^F→aada:您的意思是?01/27 13:01

[問題] CUDA 警告:subscript out of range

[ C_and_CPP ]10 留言, 推噓總分: +1

作者: aada - 發表於 2010/01/18 15:36(16年前)

2^F→aada:你好,這個警告i,j的位置沒有關係~01/18 15:48

4^F→aada:但是為什麼我在c上面,也是yy[qqx][qqy],但編譯沒有顯示警告呢01/18 16:07

8^F→aada:請問我不使用return的畫還有其他方法傳回來嗎?thx01/18 23:11

10^F→aada:這只是我程式的一部分,因為主要出線的警告在這,就PO這了01/19 00:46

Re: [問題] CUDA CUFFT fft要如何shift?

[ C_and_CPP ]10 留言, 推噓總分: +3

作者: lgen7604 - 發表於 2010/01/10 00:58(16年前)

1^F推aada:假如說今天只是3x3的矩陣,要怎麼分四個象限呢,謝謝01/10 02:09

2^F→aada:請問一下,我想對虛數(值=1000)部分做exp,01/10 03:04

3^F→aada:exp(a[0][0].y)=無限大, 要怎麼才可以做出exp(1000i)呢01/10 03:04

10^F→aada:謝謝你們01/10 13:05

首頁

尾頁