作者查詢 / aada
作者 aada 在 PTT [ C_and_CPP ] 看板的留言(推文), 共136則
限定看板:C_and_CPP
看板排序:
全部C_and_CPP136MATLAB120LCD113SJU102RDSS78BigSanchung67Physics60Gossiping48PlayStation45Tech_Job41HsinChuang38MLBGAME34BabyMother30Web_Design27hair_loss21FixMyHouse20Master_D15Waa15graduate14NBAGAME14GTA13CMWang11creditcard10Japan_Travel10TY_Research8Electronics6Network6NFS6Windows6Wrestle6NBA5Nightmarket5Polytechnic5Aikido4Hualien4Notebook4PhD4TKU_TSPCB934Wen-Shan4Cad_Cae3Little-Games3Printer_scan3Spurs3VideoCard3Android2Bank_Service2CSMU-MT932CSSE2CTS2Daan2Database2Emulator2EZsoft2GIS2hardware2home-sale2KUAS2movie2NUU_ER2shoes2specialman2Steam2Stock2Tennis2WorldCup2Beauty1Broad_Band1BSB1Cavaliers1DragonBall1EatToDie1Ecophilia1Food1Free_box1Gamesale1Garena1Google1GreenParty1Hotel1HSNU_10551HSNU_10651Key_Mou_Pad1Linda1MMA1Moto_GP1MP96-2T1nb-shopping1NBA_Fantasy1NBALive1NCCU07_Ghis1NCUE1NDHU-ChBT1NDHU-His961NDMC-P921Nets1NKUTEE1NTHU_TM961Nuggets1PeopleSeries1Rubiks1SeoHee1SHAQ1Shu-Lin1ShuangHe1SongShan1SpaceArt1TKU-IE941TNFSH96101transgender1Uni-Service1UTAH-JAZZ1WuGu-BaLi1<< 收起看板(112)
1F→:嗯, 我大致上了解了, 謝謝你02/28 00:15
1F→:如果我今天矩陣是比較大的畫,如512*512
2F→:dim3 blocks, threadsIM5好像就不可以這樣寫了,是嗎
3F→:int bx = (NNx + BLOCK_SIZE - 1) / BLOCK_SIZE;
4F→:dim3 blocks(bx, bx);
5F→:dim3 threads(BLOCK_SIZE, BLOCK_SIZE);
6F→:BLOCK_SIZE 我設為16
7F推:我IM5大致上試出來了
8F→:dim3 blocksIM5( 16, 73);
9F→:dim3 threadsIM5( 32, 7 );
10F→:movaIM5<<<blocksIM5, threadsIM5>>>( d_input, d_IM5 );
11F→:這樣剛好處理(16*32=512, 73*7=511) --> 512*511的矩陣
12F→:我這樣寫的方式OK嗎,有什麼地方可以改進的
13F→:我那樣設定是為了我只是取512*511的矩陣,所以將block,threds02/24 02:26
14F→:設為那樣, 如果矩陣不一樣的話,就得改了02/24 02:27
18F→:謝謝你, 想請教你一個觀念問題, 你怎麼想出來是用if來寫呢,02/24 14:17
19F→:以及寫CUDA時您是怎麼來思考的, 我對CUDA的經驗還沒有很深.02/24 14:19
1F→:如果我今天矩陣是比較大的畫,如512*51202/23 12:08
2F→:dim3 blocks, threadsIM5好像就不可以這樣寫了,是嗎02/23 12:10
3F→:int bx = (NNx + BLOCK_SIZE - 1) / BLOCK_SIZE;02/23 12:20
4F→:dim3 blocks(bx, bx);02/23 12:20
5F→:dim3 threads(BLOCK_SIZE, BLOCK_SIZE);02/23 12:21
6F→:BLOCK_SIZE 我設為1602/23 12:21
7F推:我IM5大致上試出來了02/23 22:22
8F→:dim3 blocksIM5( 16, 73);02/23 22:23
9F→:dim3 threadsIM5( 32, 7 );02/23 22:23
10F→:movaIM5<<<blocksIM5, threadsIM5>>>( d_input, d_IM5 );02/23 22:23
11F→:這樣剛好處理(16*32=512, 73*7=511) --> 512*511的矩陣02/23 22:25
12F→:我這樣寫的方式OK嗎,有什麼地方可以改進的02/23 22:25
1F→:謝謝你,我試試看02/21 21:30
2F→:我的kernel程式如下面,就可以產生矩陣B了,02/21 23:55
3F→:__global__ void movaIM11(float *input1, float *output1)02/21 23:55
4F→:{ int col = blockIdx.x*blockDim.x+threadIdx.x;02/21 23:55
5F→:int row = blockIdx.y*blockDim.x+threadIdx.y;02/21 23:55
6F→:output1[row*NNx+col] = input1[row*NNx+col];02/21 23:56
7F→:}02/21 23:56
2F→:嗯嗯, 我是想說是否有辦法使用CUDA來完成上面的程式02/21 19:25
4F→:我目前是在host上molloc好矩陣A,然後由CUDA來處理矩陣B02/21 20:12
5F→:我要如何在kernel中來表示搬移的寫法02/21 20:14
8F→:嗯嗯,我都是在host上malloc,搬移給CUDA處理02/21 20:25
9F→:至於搬移的動作, kernel應該要怎麼來寫, 目前上面的kernel02/21 20:26
10F→:是把全部都般鍋去02/21 20:26
2F推:謝謝大大, 假設我今天要對FFT後的數據處理的話,我是不是要再02/01 11:12
3F→:另外創造一個4x4的矩陣,將FFT後的值傳入到新的矩陣呢02/01 11:13
2F→:謝謝您01/30 02:28
2F→:您的意思是?01/27 13:01
2F→:你好,這個警告i,j的位置沒有關係~01/18 15:48
4F→:但是為什麼我在c上面,也是yy[qqx][qqy],但編譯沒有顯示警告呢01/18 16:07
8F→:請問我不使用return的畫還有其他方法傳回來嗎?thx01/18 23:11
10F→:這只是我程式的一部分,因為主要出線的警告在這,就PO這了01/19 00:46
1F推:假如說今天只是3x3的矩陣,要怎麼分四個象限呢,謝謝01/10 02:09
2F→:請問一下,我想對虛數(值=1000)部分做exp,01/10 03:04
3F→:exp(a[0][0].y)=無限大, 要怎麼才可以做出exp(1000i)呢01/10 03:04
10F→:謝謝你們01/10 13:05