討論串[問題] 如何讓計算速度發揮到極限
共 5 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓1(1推 0噓 1→)留言2則,0人參與, 最新作者cackerDT (大力貓)時間12年前 (2013/08/21 22:36), 編輯資訊
0
1
0
內容預覽:
我不清楚你的流體要計算甚麼東西. 不過,這邊提供一些個人的經驗. 我寫過一個折射程式(應該說還持續在寫XDD). 也是GPU跟CPU分工運算,. 我是儘量少用遞迴的寫法(程式中沒有用到),. 然後需要"大量"迴圈計算的部分再丟給GPU,少量的就不用了. 再來,我認為最重要的是數學式子,. 想辦法簡化
(還有55個字)

推噓2(2推 0噓 0→)留言2則,0人參與, 最新作者johnjohnlin (LYSin8)時間12年前 (2013/08/15 23:39), 編輯資訊
0
0
0
內容預覽:
我剛剛嘗試了一下. 平台是. g++, openmp, core i5 2500, linux 64. 首先. 有人提到 vector 的問題. 根據我的測試是這樣(無平行). L = 1000, 50 iteration. g++ -O2 g++ -g. vec of vec 0.124 1.60
(還有2194個字)

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者Leon (Achilles)時間12年前 (2013/08/15 16:29), 編輯資訊
0
0
0
內容預覽:
..... 在最佳化之前, 我習慣是去 check algorithm 上面的解法.. 你的問題是 parallel Jacobi,. 這個問題非常古老, 有很多 multi-threading 的方式去做.. www.cfm.brown.edu/people/gk/AM258/Handouts/W
(還有71個字)

推噓5(5推 0噓 5→)留言10則,0人參與, 最新作者littleshan (我要加入劍道社!)時間12年前 (2013/08/15 00:42), 編輯資訊
0
0
0
內容預覽:
原本的例子有點複雜,我這邊舉個簡化後的例子. 假設還沒拆迴圈的 code 長這樣:. for(int i = 0; i < N; ++i). v_new[i] = v[i] + rho[i];. 我講的拆迴圈 (loop unrolling) 意指一次處理多個元素. for(int i = 0; i
(還有1255個字)

推噓8(8推 0噓 45→)留言53則,0人參與, 最新作者Lepton (輕子)時間12年前 (2013/08/14 23:05), 編輯資訊
0
0
0
內容預覽:
hi,hi 感謝各位之前熱情的回覆讓我學到用binary方式寫檔案. 我才發現原來binary的方式這麼好用. 小的我有另外的問題想請教大家. 在做流體計算時繁複的計算我都是丟到GPU上計算. 計算的效率幾乎都是2TLOPs以上,可以發揮到顯示卡計算能力極限的70%左右. (以GTX680為例2 F
(還有869個字)
首頁
上一頁
1
下一頁
尾頁