[問題] 如何讓計算速度發揮到極限

看板C_and_CPP作者Lepton (輕子)時間12年前 (2013/08/14 23:05)推噓8(8推 0噓 45→)

留言53則, 7人參與討論串1/5 (看更多)

hi,hi 感謝各位之前熱情的回覆讓我學到用binary方式寫檔案我才發現原來binary的方式這麼好用小的我有另外的問題想請教大家在做流體計算時繁複的計算我都是丟到GPU上計算計算的效率幾乎都是2TLOPs以上，可以發揮到顯示卡計算能力極限的70%左右 (以GTX680為例2 FLOPS/Clock × 1006 MHz × 1536 = 3.090 TFLOPS) 但是同樣的計算放到CPU上都<10GFLOPs，幾乎不到CPU計算能力極限的10% (以Ivy Bridge為例 8 FLOPS/Clock × 3.5GHz ×4 = 102.4 GFLOPS ) 乍看之下GPU好像加速幾乎上百上千倍的計算速度但其實CPU根本沒發揮真本事在GPU的情況編譯器會把乘加合併成一條指令去做才能做到2 FLOPS/Clock 那在CPU的部分要啟用SSE指令集或AVX指令集的話是要自己去編寫嗎?還是編譯器會做? 因為我在VC2010 中加入/arch:AVX之類的指令但速度並沒有增加我這邊做的事情基本上就是迭代計算 vector<vector<double> > V, VNew ,rho; void Jacobi() { #pragma omp parallel for for (int i = 1; i <= L; i++) #pragma omp parallel for for (int j = 1; j <= L; j++) VNew[i][j] = 0.25 * (V[i - 1][j] + V[i + 1][j] + V[i][j - 1] + V[i][j + 1] + h * h * rho[i][j]); } -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 1.170.79.135

→

08/14 23:27, , 1^F

08/14 23:27, 1^F

→

08/14 23:29, , 2^F

08/14 23:29, 2^F

→

08/14 23:29, , 3^F

08/14 23:29, 3^F

推

08/14 23:30, , 4^F

08/14 23:30, 4^F

→

08/14 23:31, , 5^F

08/14 23:31, 5^F

→

08/14 23:34, , 6^F

08/14 23:34, 6^F

→

08/14 23:34, , 7^F

08/14 23:34, 7^F

→

08/14 23:35, , 8^F

08/14 23:35, 8^F

→

08/14 23:39, , 9^F

08/14 23:39, 9^F

推

08/14 23:39, , 10^F

08/14 23:39, 10^F

→

08/14 23:40, , 11^F

08/14 23:40, 11^F

→

08/14 23:40, , 12^F

08/14 23:40, 12^F

→

08/14 23:41, , 13^F

08/14 23:41, 13^F

推

08/14 23:43, , 14^F

08/14 23:43, 14^F

→

08/14 23:44, , 15^F

08/14 23:44, 15^F

→

08/14 23:52, , 16^F

08/14 23:52, 16^F

可以給點示範嗎?拆掉內層迴圈無所謂 ※ 編輯: Lepton 來自: 1.170.79.135 (08/14 23:56)

→

08/14 23:57, , 17^F

08/14 23:57, 17^F

→

08/14 23:57, , 18^F

08/14 23:57, 18^F

→

08/15 00:00, , 19^F

08/15 00:00, 19^F

hi,我知道在GPU也有cache的問題但在CPU上要怎樣處理這個問題我不熟悉請問可以給點參考資料嗎?我先google研究看看不懂再來提問好了 ※ 編輯: Lepton 來自: 1.170.79.135 (08/15 00:02)

→

08/15 00:05, , 20^F

08/15 00:05, 20^F

→

08/15 00:05, , 21^F

08/15 00:05, 21^F

→

08/15 00:32, , 22^F

08/15 00:32, 22^F

→

08/15 00:33, , 23^F

08/15 00:33, 23^F

→

08/15 00:42, , 24^F

08/15 00:42, 24^F

→

08/15 00:43, , 25^F

08/15 00:43, 25^F

→

08/15 00:46, , 26^F

08/15 00:46, 26^F

→

08/15 00:47, , 27^F

08/15 00:47, 27^F

推

08/15 00:50, , 28^F

08/15 00:50, 28^F

→

08/15 00:54, , 29^F

08/15 00:54, 29^F

→

08/15 00:55, , 30^F

08/15 00:55, 30^F

QQ這邊大家討論的東西好深奧我都不懂!看來我C/C++沒學好 ※ 編輯: Lepton 來自: 111.252.0.105 (08/15 01:00)

→

08/15 01:13, , 31^F

08/15 01:13, 31^F

→

08/15 01:14, , 32^F

08/15 01:14, 32^F

→

08/15 01:17, , 33^F

08/15 01:17, 33^F

→

08/15 01:20, , 34^F

08/15 01:20, 34^F

→

08/15 01:21, , 35^F

08/15 01:21, 35^F

→

08/15 01:47, , 36^F

08/15 01:47, 36^F

→

08/15 01:53, , 37^F

08/15 01:53, 37^F

→

08/15 01:53, , 38^F

08/15 01:53, 38^F

→

08/15 02:08, , 39^F

08/15 02:08, 39^F

推

08/15 06:08, , 40^F

08/15 06:08, 40^F

→

08/15 06:09, , 41^F

08/15 06:09, 41^F

→

08/15 08:43, , 42^F

08/15 08:43, 42^F

→

08/15 08:46, , 43^F

08/15 08:46, 43^F

→

08/15 08:46, , 44^F

08/15 08:46, 44^F

推

08/15 10:45, , 45^F

08/15 10:45, 45^F

→

08/15 10:46, , 46^F

08/15 10:46, 46^F

→

08/15 11:06, , 47^F

08/15 11:06, 47^F

→

08/15 11:07, , 48^F

08/15 11:07, 48^F

→

08/15 11:09, , 49^F

08/15 11:09, 49^F

推

08/15 13:09, , 50^F

08/15 13:09, 50^F

→

08/15 16:42, , 51^F

08/15 16:42, 51^F

推

08/15 23:07, , 52^F

08/15 23:07, 52^F

→

08/15 23:07, , 53^F

08/15 23:07, 53^F

‣ 返回看板[ C_and_CPP ] 程設

‣ 更多 Lepton 的文章

文章代碼(AID): #1I2vp5YO (C_and_CPP)

討論串 (同標題文章)

以下文章回應了本文 (最舊先)：

問題

2

2

Re: [問題] 如何讓計算速度發揮到極限 Re: 如何讓計算速度發揮到極限

12年前, 08/15

問題

1

1

Re: [問題] 如何讓計算速度發揮到極限 Re: 如何讓計算速度發揮到極限

12年前, 08/15

問題

5

10

Re: [問題] 如何讓計算速度發揮到極限 Re: 如何讓計算速度發揮到極限

12年前, 08/15

完整討論串 (本文為第 1 之 5 篇)：

排序：最新先 | 最舊先 | 留言數

問題

1

2

Re: [問題] 如何讓計算速度發揮到極限 Re: 如何讓計算速度發揮到極限

12年前, 08/21

問題

2

2

Re: [問題] 如何讓計算速度發揮到極限 Re: 如何讓計算速度發揮到極限

12年前, 08/15

問題

1

1

Re: [問題] 如何讓計算速度發揮到極限 Re: 如何讓計算速度發揮到極限

12年前, 08/15

問題

5

10

Re: [問題] 如何讓計算速度發揮到極限 Re: 如何讓計算速度發揮到極限

12年前, 08/15

問題

8

53

[問題] 如何讓計算速度發揮到極限如何讓計算速度發揮到極限

12年前, 08/14

在新視窗開啟完整討論串 (共5篇)

‣ 返回看板[ C_and_CPP ] 程設

‣ 更多 Lepton 的文章

文章代碼(AID): #1I2vp5YO (C_and_CPP)