[問題] CUDA 執行結果問題

看板C_and_CPP作者v00623 (阿哩他命EX PLUS)時間8年前 (2017/05/08 09:48)推噓2(2推 0噓 3→)

留言5則, 2人參與討論串1/1

開發平台(Platform): (Ex: Win10, Linux, ...) Linux GPGPU-sim 編譯器(Ex: GCC, clang, VC++...)+目標環境(跟開發平台不同的話需列出) nvcc 問題(Question)：正在練習簡單的vectorAdd 原本是在main()中呼叫function來launch kernel 這樣沒問題不過想試著把launch kernel放到main()中但卻沒有出現如預期的結果目前找不到是什麼問題預期的正確結果(Expected Output)： dataD = 1.000000 dataD = 1.000000 dataD = 1.000000 dataD = 1.000000 dataD = 1.000000 dataD = 1.000000 dataD = 1.000000 dataD = 1.000000 dataD = 1.000000 dataD = 1.000000 錯誤結果(Wrong Output)： dataD = 1.000000 dataD = 1.000000 dataD = 0.000000 dataD = 0.000000 dataD = 0.000000 dataD = 0.000000 dataD = 0.000000 dataD = 0.000000 dataD = 0.000000 dataD = 0.000000 程式碼(Code)：(請善用置底文網頁, 記得排版) __global__ void VectorAdd( float* arrayA, float* arrayB, float* output ) { int idx = threadIdx.x; output[idx] = arrayA[idx] + arrayB[idx] + 1; } void add_vector_gpu( float* a, float* b, float *c, int size ); int main( int argc, char** argv){ int data_size = 10; float *dataA = new float[data_size], *dataB = new float[data_size], *dataC = new float[data_size], *dataD = new float[data_size], *dataE = new float[data_size]; for( int i = 0; i < data_size; ++ i ) { dataA[i] = i; dataB[i] = -1 * i; } add_vector_cpu( dataA, dataB, dataC, data_size ); float data_size2 = data_size * sizeof(float); float *dev_A, *dev_B, *dev_C, *dev_D; cudaMalloc( (void**)&dev_A, data_size2 ); cudaMalloc( (void**)&dev_B, data_size2 ); cudaMalloc( (void**)&dev_C, data_size2 ); cudaMalloc( (void**)&dev_D, data_size2 ); cudaMemcpy( dev_A, dataA, data_size, cudaMemcpyHostToDevice ); cudaMemcpy( dev_B, dataB, data_size, cudaMemcpyHostToDevice ); VectorAdd<<< 1, 10 >>>( dev_A, dev_B, dev_C ); cudaMemcpy( dataD, dev_C, data_size, cudaMemcpyDeviceToHost ); for( int i = 0; i < data_size; ++ i ) { printf( "dataD = %f\n", dataD[i] ); } } 補充說明(Supplement)：另外想請問如果想在kernel中printf一些資料該怎麼做有看到說要 #include "cuPrintf.cu" 才可以使用 cuPrintf ("Thread_number %d\n", threadIdx.x); 但還是沒有print 是不是方法用錯? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.118.155.204 ※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1494208139.A.3C4.html

推

mike0227

05/08 11:26, , 1^F

05/08 11:26, 1^F

→

mike0227

05/08 11:27, , 2^F

05/08 11:27, 2^F

→

mike0227

05/08 11:27, , 3^F

05/08 11:27, 3^F