作者查詢 / jun0325
作者 jun0325 在 PTT [ C_and_CPP ] 看板的留言(推文), 共41則
限定看板:C_and_CPP
看板排序:
首頁
上一頁
1
下一頁
尾頁
20F推: OpenCL可以用在更多的device上(CPU, GPU, DSP等只要符08/24 00:19
21F→: 合OpenCL規範),HIP看起來只能用在AMD/NV的GPU上,我這08/24 00:19
22F→: 樣理解對嗎?08/24 00:19
23F推: 用volatile應該就會讓compiler每次都會寫回memory了吧10/16 22:12
8F→: https://en.m.wikipedia.org/wiki/CUDA spec有說block的x09/15 15:47
9F→: y z的maximum09/15 15:47
23F推: 加個cudaThreadSynchronize();確保GPU和CPU之間的07/16 14:04
24F→: data consistency。你變成data size變成200,有可能是GPU07/16 14:05
25F→: 算太久,你又沒保證data consistency,所以CPU讀到不正確07/16 14:06
26F→: 的資料07/16 14:06
4F推: stream是一個software queue的概念 如果你把兩個kernel b06/20 19:58
5F→: ound在同一個stream 那就會sequential執行 如果在不同str06/20 19:58
6F→: eam就會用spatial的方式來將兩個kernel 綁到SM上06/20 19:58
7F→: 建議直接爬gpu-sim怎麼運作的會更清楚06/20 20:28
1F推: 我記得intel的內顯都是有LLC,所以都是看到同樣的memory10/24 16:03
2F→: address,所以才測不出來memory copy的時間10/24 16:04
158F→: 硬體沒有難不難做...只是要看compiler和硬體要如何合作罷08/17 01:10
159F→: 了。就算你新增了bit field的語意,要讓它跑在原本的CPU08/17 01:10
160F→: 也是可以,就只是讓compiler增加原本的工作去support你要08/17 01:10
161F→: 的語意,用原本的ISA去拼出你想要的functionality,反之08/17 01:10
162F→: 亦然,可以extend ISA減少compiler的工作。08/17 01:10
163F→: 不過要讓不同長度的變數pack到同一個register裡,你要讓08/17 01:18
164F→: 硬體如何對其中一個變數做運算XD。我能想到最接近的概念08/17 01:18
165F→: 就是SSE了。08/17 01:18
166F→: 可以參考這http://goo.gl/ahdejN讓你對register packing08/17 01:23
167F→: 會比較有概念08/17 01:23
50F推: 一個SM的warp scheduler可以schedule來自在不同block的05/07 21:02
51F→: warp (SM裡面的warp scheduler可能不只一個要看硬體)05/07 21:03
52F→: 基本上warp scheduler的policy最簡單也最好用的是GTO05/07 21:04
53F→: (大部分情況下比RR好) 回歸正題,一個block"的確"要等到05/07 21:05
54F→: 最後一個warp執行完,才會release他所佔的資源05/07 21:05
55F→: 這也就是為什麼在寫CUDA的時候,盡量要讓每個thread的05/07 21:06
56F→: 工作量都要相近,這樣才能盡可能在同一個時間點做完05/07 21:06
57F→: 早點release resource給下一個block使用05/07 21:07
58F→: W大所說的可以先偷塞新的block的warp進去SM05/07 21:08
59F→: 但這就增加了硬體對於SM管理資源的複雜度05/07 21:09
60F→: 你要特別建一個表去記錄那個快結束block中的warp05/07 21:10
61F→: 分別占了SM上面的那些資源(Register, Shared Memory)05/07 21:11
62F→: 因為原本SM對於資源的控管是以block granularity05/07 21:14
63F→: 如果要達成W大所說的那個方式,就要對每個"warp"都要去05/07 21:15
64F→: 記錄他們所站的資源05/07 21:15
首頁
上一頁
1
下一頁
尾頁