[問題] cuda解帶狀矩陣

看板C_and_CPP作者 (smile)時間13年前 (2010/10/20 02:13), 編輯推噓0(006)
留言6則, 2人參與, 最新討論串1/1
遇到的問題: (題意請描述清楚) 是這樣的 目前我在嘗試用tdma的方法來解帶狀矩陣 然而尚未在gpu內算的整各運算都是對的 而在將程式改為到gpu內運算 (尚未改動任何code) 而結果出來均為-627743856220419250000以下都是0 答案應該要是x1= 1 x2= 2 ... x5= 5 不過有時候出現是有點indXXXXX那各錯誤 我不斷的有改動過 所以有點忘記 囧"> 我個人是覺得CODE 尚未改動 而他也是照用單核心的模式去跑運算 基本上CODE一樣 我的變數型態一樣 應該是不會有錯的吧 囧"> 可以請各位給我點方向嘛ORZ~ 感謝各位了! 開發平台: (例: VC++ or gcc/g++ or Dev-C++, Windows or Linux) 有問題的code: (請善用置底文標色功能) http://nopaste.csie.org/f1c4b 補充說明: -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.125.160 ※ 編輯: X400 來自: 140.113.125.160 (10/20 02:14) ※ 編輯: X400 來自: 140.113.125.160 (10/20 02:19) ※ 編輯: X400 來自: 140.113.125.160 (10/20 02:28)

10/20 09:42, , 1F
TDMA_cuda<<<num/BLOCK+1,BLOCK>>> <---不填1,1嗎
10/20 09:42, 1F

10/20 09:43, , 2F
你知道11-12行被執行幾次嗎...接下來的每個點也都有類似問
10/20 09:43, 2F

10/20 09:43, , 3F
10/20 09:43, 3F

10/20 15:37, , 4F
我填過1,1了 但是結果仍然一樣阿..
10/20 15:37, 4F

10/20 16:00, , 5F
sizeof(float) <--?
10/20 16:00, 5F
※ 編輯: X400 來自: 140.113.125.160 (10/20 16:07)

10/20 16:40, , 6F
解決了...好像是我環境設定錯誤 otz 另外一台可以跑
10/20 16:40, 6F
文章代碼(AID): #1ClT-zpQ (C_and_CPP)