[問題] cuda解帶狀矩陣
遇到的問題: (題意請描述清楚)
是這樣的 目前我在嘗試用tdma的方法來解帶狀矩陣
然而尚未在gpu內算的整各運算都是對的
而在將程式改為到gpu內運算 (尚未改動任何code)
而結果出來均為-627743856220419250000以下都是0
答案應該要是x1= 1
x2= 2
...
x5= 5
不過有時候出現是有點indXXXXX那各錯誤
我不斷的有改動過 所以有點忘記 囧">
我個人是覺得CODE 尚未改動 而他也是照用單核心的模式去跑運算
基本上CODE一樣 我的變數型態一樣 應該是不會有錯的吧 囧">
可以請各位給我點方向嘛ORZ~ 感謝各位了!
開發平台: (例: VC++ or gcc/g++ or Dev-C++, Windows or Linux)
有問題的code: (請善用置底文標色功能)
http://nopaste.csie.org/f1c4b
補充說明:
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.125.160
※ 編輯: X400 來自: 140.113.125.160 (10/20 02:14)
※ 編輯: X400 來自: 140.113.125.160 (10/20 02:19)
※ 編輯: X400 來自: 140.113.125.160 (10/20 02:28)
→
10/20 09:42, , 1F
10/20 09:42, 1F
→
10/20 09:43, , 2F
10/20 09:43, 2F
→
10/20 09:43, , 3F
10/20 09:43, 3F
→
10/20 15:37, , 4F
10/20 15:37, 4F
→
10/20 16:00, , 5F
10/20 16:00, 5F
※ 編輯: X400 來自: 140.113.125.160 (10/20 16:07)
→
10/20 16:40, , 6F
10/20 16:40, 6F