[問題] CUDA Memcpy相關問題

看板C_and_CPP作者v00623 (阿哩他命EX PLUS)時間7年前 (2017/07/12 17:25)推噓1(1推 0噓 25→)

留言26則, 3人參與討論串1/1

開發平台(Platform): (Ex: Win10, Linux, ...) Linux GPGPU-Sim 問題(Question)：目前正在測試dependent kernel kernel A 負責兩個陣列相加存到result array kernel B 把kernel A的reult + 1 再將結果與CPU運算結果比對一般的寫法是： 1.Memcpy兩個陣列的data到device 2.launch kernel A 3.將result複製回host 4.把result傳到device 5.launch kernel B 6.將運算結果複製回host 7.比對但我把第三四步驟省略比對結果也是正確的請問是為什麼呢？是因為kernel B需要的data與kernel A的result array記憶體位置相同？或是有其他原因？程式碼如下 https://gist.github.com/anonymous/5d8b6c58ce7ecd0407f6595d41fd8a2c 後來我改變他的data_size 例如200(原本是100) 結果前100個正確後100個錯誤這又是為什麼？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.118.155.192 ※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1499851515.A.90A.html

→

07/12 17:41, , 1^F

07/12 17:41, 1^F

→

07/12 17:44, , 2^F

07/12 17:44, 2^F

→

07/12 17:44, , 3^F

07/12 17:44, 3^F

→

07/12 17:45, , 4^F

07/12 17:45, 4^F

→

07/12 17:45, , 5^F

07/12 17:45, 5^F

→

07/12 17:46, , 6^F

07/12 17:46, 6^F

→

07/12 17:46, , 7^F

07/12 17:46, 7^F

為什麼3,4是多餘的？是遇到要使用相同的data就可以不用這兩個步驟的意思？ VectorAdd2作用是把VectorAdd1的結果再加一整個程式目的是要測試不做3,4會不會影響結果改成blockIdx.x*blockDim.x + threadIdx.x確實是正確了不過我block只有一個那麼blockIdx.x為0 跟原本只用threadIdx.x有差別嗎？還是我哪裡誤會了？

→

07/12 18:46, , 8^F

07/12 18:46, 8^F

你是指VectorAdd2<<<1, size>>>(....) ^^^這個嗎我block size設跟data size相同原本100 結果正確換成200後錯一半

→

07/12 19:05, , 9^F

07/12 19:05, 9^F

→

07/12 19:05, , 10^F

07/12 19:05, 10^F

blockIdx.x 印出來是0 blockDim.x 印出來是200 也就是data_size threadIdx.x 印出來是0~199 跟我想的一樣.... 現在有點搞混了我把idx那行改回我最原本那樣結果是正確的我再看清楚我到底改了哪裡 -------------------------------------- 我比較想了解的地方是有相依的kernel間的data 可以不用回傳? 請問原理是什麼?

→

07/12 19:57, , 11^F

07/12 19:57, 11^F

→

07/12 19:57, , 12^F

07/12 19:57, 12^F

→

07/12 19:58, , 13^F

07/12 19:58, 13^F

→

07/12 20:01, , 14^F

07/12 20:01, 14^F

0.0 哈哈犒賞自己買下去! 不過回到我問的記憶體沒有free掉所以意思是他存取同個地方囉那麼會存取同位址是為什麼? 這個可以解釋一下嗎

→

07/12 21:20, , 15^F

07/12 21:20, 15^F

→

07/12 21:20, , 16^F

07/12 21:20, 16^F

你的意思是因為都是dev_C 記憶體位置就是那裏所以我launch VectorAdd2 後面帶參數dev_C 那麼他就會去讀這個記憶體位址所以就會拿到正確的資料是這樣嗎?

→

07/12 21:24, , 17^F

07/12 21:24, 17^F

→

07/12 21:27, , 18^F

07/12 21:27, 18^F

很慢我知道只是我不知道原來可以這樣做

→

07/13 08:45, , 19^F

07/13 08:45, 19^F

→

07/13 08:45, , 20^F

07/13 08:45, 20^F

→

07/13 08:46, , 21^F

07/13 08:46, 21^F

→

07/13 08:48, , 22^F

07/13 08:48, 22^F

好的這部分我瞭解了感謝你 ※ 編輯: v00623 (140.118.155.204), 07/13/2017 10:16:46

推

07/16 14:04, , 23^F

07/16 14:04, 23^F

→

07/16 14:05, , 24^F

07/16 14:05, 24^F

→

07/16 14:06, , 25^F

07/16 14:06, 25^F

→

07/16 14:06, , 26^F

07/16 14:06, 26^F

‣ 返回看板[ C_and_CPP ] 程設

‣ 更多 v00623 的文章

文章代碼(AID): #1PPUhxaA (C_and_CPP)