作者查詢 / HsiaoCC

總覽項目：發文 | 留言 | 暱稱

作者 HsiaoCC 在 PTT [ VideoCard ] 看板的留言(推文), 共31則

限定看板：VideoCard

首頁

尾頁

Re: [請益] 請問 CUDA 每個 block 可使用多少 shar …

[ VideoCard ]5 留言, 推噓總分: +2

作者: mself - 發表於 2010/06/03 08:47(15年前)

1^F推HsiaoCC:google了一下每個block的上限就是總共16K，超過應該不能跑06/03 10:11

2^F→HsiaoCC:我沒寫過CUDA，但OpenCL的情況是會直接return error06/03 10:13

3^F→HsiaoCC:若你指的是所有threads總共用16K，那情況會跟你寫的一樣~06/03 10:15

4^F→HsiaoCC:眼殘，應該是若每個block裡的threads共用了16K~~~06/03 10:17

Re: [請益] 請問 CUDA 每個 block 可使用多少 shar …

[ VideoCard ]19 留言, 推噓總分: +4

作者: HsiaoCC - 發表於 2010/06/03 01:10(15年前)

3^F→HsiaoCC:就我對它的了解，只要在resource允許情況下，看起來沒差…06/03 01:39

4^F→HsiaoCC:但是，block內之threads需要能sync，碰到需要sync的比較傷06/03 01:40

7^F→HsiaoCC:跑不同kernel，似乎是scheduling的問題，但是我沒實際試過06/03 01:45

8^F→HsiaoCC:Fermi whitepaper 上有提到多個 kernel 時排程的改進~~06/03 01:45

11^F→HsiaoCC:拿之前跑的數據算了一下，切block效能影響是有，但有限~~06/03 01:50

12^F→HsiaoCC:只要讓每個block保持>=64 threads，切換 block 對效能的06/03 01:50

14^F→HsiaoCC:影響，大概只有10ns不到…06/03 01:50

16^F→HsiaoCC:切block，我用OpenCL在GTX285上測，感覺效率影響不明顯:~~06/03 01:57

17^F→HsiaoCC:反而是要怎麼找到上百個threads在同一個SM上run比較麻煩06/03 01:58

18^F→HsiaoCC:不過如果block切太少，反而造成有SM idle這樣不更慘？:~~06/03 02:00

[情報] GTX 485

[ VideoCard ]8 留言, 推噓總分: +2

作者: AshToX - 發表於 2010/05/17 23:41(15年前)

1^F→HsiaoCC:發文時間是 4/1 …05/17 23:48

[情報] 工程師：Intel Larrabee將會絕地反擊

[ VideoCard ]11 留言, 推噓總分: +2

作者: gt1724 - 發表於 2010/03/13 10:41(16年前)

6^F推HsiaoCC:就目前的 larrabee 看起來也是耗電跟發熱怪物…03/13 16:20

7^F→HsiaoCC:我倒覺得弄成精簡版的指令集會讓這情況好些…03/13 16:20

8^F→HsiaoCC:現階段的larrabee看起來是支援完整pentium指令集+avx ext03/13 16:20

9^F→HsiaoCC:光是解碼x86 instr就得花上不少時間跟電路了~~~03/13 16:21

10^F→HsiaoCC:另外一個有趣的點是，繼續用ring做互連真的好嗎？03/13 16:22

11^F→HsiaoCC:當處理器數量高過一定數量，ring其實效率不太好 ~___~03/13 16:23

[情報] Fermi產品名稱確定，GTX470/GTX480擔當 …

[ VideoCard ]13 留言, 推噓總分: +6

作者: gt1724 - 發表於 2010/02/02 11:05(16年前)

2^F推HsiaoCC:還可以再來個外掛加強版 GT500KR 是吧… (誤)02/02 11:43

[請益] 請問 HD3200 能用Windowns Aero嗎? 要灌WIN 7

[ VideoCard ]13 留言, 推噓總分: +4

作者: shihche623 - 發表於 2010/01/13 13:28(16年前)

2^F推HsiaoCC:我筆電上的 HD3470 在 win7 下的 win aero 是正常的…01/13 13:44

3^F→HsiaoCC:理論上應該都能跑才是，連Intel GMA 4500 都能跑了…01/13 13:45

Re: [問題] 請問計算機架構的書，看那本好?

[ VideoCard ]12 留言, 推噓總分: +5

作者: jk21234 - 發表於 2009/12/03 15:03(16年前)

2^F推HsiaoCC:Niagra 是 SUN 的吧？一代單核4 threads，二代 8 thrds12/03 16:27

3^F推HsiaoCC:IA64是不錯的東西，可惜生錯時代…12/03 16:29

8^F推HsiaoCC:Niagara一代八個core share一個fp，二代每個core一個fp12/04 00:42

9^F→HsiaoCC:裡面的fp其實是用來支援sparc vis 2.0 instr set ...12/04 00:43

10^F→HsiaoCC:覺得把他視為跟 intel mmx/sse 之流會比當他想搶GPU看適合12/04 00:43

11^F→HsiaoCC:GPU有太多需要fp的地方，niagara這樣的配置會炸…12/04 00:44

[請益] NFS哪牌顯卡好

[ VideoCard ]43 留言, 推噓總分: +16

作者: advance760 - 發表於 2009/10/13 18:42(16年前)

29^F推HsiaoCC:i5-750 + 5850 特效全開 1680x1050 還滿順的… XD10/14 07:33

首頁

尾頁