[問題] CUDA 新手, threads 之間相加的問題

看板C_and_CPP作者MikePhysics (@@)時間12年前 (2013/05/07 23:05)推噓1(1推 0噓 10→)

留言11則, 5人參與討論串1/1

開發平台(Platform): (Ex: VC++, GCC, Linux, ...) Unix 額外使用到的函數庫(Library Used): (Ex: OpenGL, ...) CUDA 問題(Question)： global 和 shared 的變數累加後的答案一樣餵入的資料(Input)： N/A 預期的正確結果(Expected Output)： a_sh[threadIdx.x] = 1 *a = 8 錯誤結果(Wrong Output)： a_sh[threadIdx.x] = 1 *a = 1 程式碼(Code)：(請善用置底文網頁, 記得排版) #define N_Block 2 #define N_Thread 4 __global__ void test(int* a) { // *a = 0; __shared__ int a_sh[N_Thread]; a_sh[threadIdx.x] = 0; // __syncthreads(); *a += 1; a_sh[threadIdx.x] += 1; } int main(int argc,char **argv) { int *d_a; cudaMalloc(&d_a, sizeof(int)); cudaMemcpy(預設 *d_a = 0); test<<<N_Block, N_Thread>>>(d_a); return 0; } 補充說明(Supplement)：我應該是有觀念錯誤但怎麼樣都想不通 *a 是存在 global 裡面且是唯一的每個 blocks 裡面的 threads 都會執行 *a += 1 應該是執行了 4x2 = 8 次吧怎麼答案還是 1 呢? 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 24.11.249.170 ※ 編輯: MikePhysics 來自: 24.11.249.170 (05/08 07:08)

→

withoutshine

05/08 08:38, , 1^F

05/08 08:38, 1^F

→

MikePhysics

05/08 08:44, , 2^F

05/08 08:44, 2^F

→

akasan

05/08 09:26, , 3^F

05/08 09:26, 3^F