Re: [情報] Intel admits Ivy B chips run hotter

看板PC_Shopping作者 (BL2400PT真不錯)時間12年前 (2012/05/05 22:15), 編輯推噓27(2706)
留言33則, 32人參與, 最新討論串1/1
推 arrenwu:以 GTX680 的情況來看,6系列通用計算應該是大輸 5系列 05/04 00:59 推 cluohy75118: GK110 05/04 01:36 → cluohy75118:架構問題我比較想看jk神闡釋 可以確定的是maxwell會是 05/04 01:36 → cluohy75118:nv這幾年來真正想表現的最終型態 05/04 01:37 GTX680的GPGPU表現其實基於一個很簡單的原因...... Register:SP數量比以往減少很多. G80/G92的時候,8個SP總共使用16,384個reg,GK104則是192個SP使用65,536個reg. 比例大概是從2,048降到341,足足少了6倍. 這邊要說明一下,register的數量和每個block(SMp)對應的thread數量有關. 假如CUDA程式設定成128個thread的話,在G80/G92上就是同一個thread下真正使用 到16,384/128=128個register,這樣每個SP平均有16個reg可以用.算是蠻寬裕的. 而thread拉長,就是可以有效的隱藏Video RAM存取的延遲 常態來說這個video RAM的延遲都是100出頭個cycle,不同卡會不太一樣 所以舊的CUDA程式要求效能會以64~256個thread為主流.假定最主流的是128個thread 的話... 那這個程式在GK104上,每個thread就是192個SP分配到512個register. 由於每個SP每個CYCLE都要二讀一寫........好啦 中間計算就省略一下. 一般而言指令要有良好的平行度,不會浪費太多時間在register allocation 的時候作spill out(專有名詞,register不夠用所以把舊的資料存入記憶體) 那麼register最好是ALU總數(GPU下的例子是SP)的6~8倍.低於這數值平行度就會 很差,比這高當然效能還會好一點,但高過16倍又不一定會看到好處...因此換算起來, 192個SP分配512個register,真正的利用率可能只有1/2~1/3...意思是 和96 or 64個SP的效能差不多 那麼GTX680的1536個SP,除以這比例就剩下768~512,再除以沒有hot clock 的計算量減半.結果GK104的GPGPU表現就可能和GF104差不多會是同時脈下同等級. 實際上GK104的時脈高了一點.應該會領先少許.但約只有gtx580的75%吧. [呂布:當我不用分心在謀權之上,誰可以敢說在武力上穩勝過我] 這個問題不能說整個Kepler系列設計不重視GPGPU,應該是只有GK104如此 很有可能是因為GK104的定位可以讓他只專注在Graphics不要管GPGPU. nVidia策略上作的到HD7900作不到的一件事情.一個產品當陳宮一個產品當呂布. 只要GK110的register:SP比例提高兩倍以上(當然這就無法在同面積內塞入相同數量的 SP,大量register非常的佔面積).這樣的晶片的GPGPU表現並不會差.當然可能Graphics 的表現就不會明顯領先一截了.... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.114.78.54

05/05 22:18, , 1F
看不懂.....sad.........
05/05 22:18, 1F

05/05 22:18, , 2F
頭推
05/05 22:18, 2F

05/05 22:20, , 3F
推一下。
05/05 22:20, 3F

05/05 22:25, , 4F
05/05 22:25, 4F

05/05 22:30, , 5F
看不太懂.....
05/05 22:30, 5F

05/05 22:31, , 6F
不過說真的, 這樣 NV 每次改版都要重 tune 一次很累的.
05/05 22:31, 6F

05/05 22:33, , 7F
請問貂嬋在哪裡?
05/05 22:33, 7F

05/05 22:34, , 8F
據說GK110就是專為GPGPU設計的,大部分面向Tesla計算卡
05/05 22:34, 8F

05/05 22:43, , 9F
看不懂 但必推
05/05 22:43, 9F

05/05 22:43, , 10F
快推免得被說不懂
05/05 22:43, 10F

05/05 22:45, , 11F
嗯嗯 我也是這麼認為              呂布很強
05/05 22:45, 11F

05/05 22:46, , 12F
喔喔 原來如此
05/05 22:46, 12F

05/05 22:51, , 13F
原來如此 看不懂
05/05 22:51, 13F

05/05 22:52, , 14F
顯卡真多register@@"難怪那麼燙@@""""""""""""""""""
05/05 22:52, 14F

05/05 22:53, , 15F
火鳳火鳳
05/05 22:53, 15F

05/05 22:54, , 16F
看不懂 推!
05/05 22:54, 16F

05/05 22:58, , 17F
簡單講針對產品定位特化
05/05 22:58, 17F

05/05 23:00, , 18F
05/05 23:00, 18F

05/05 23:00, , 19F
喔喔 原來如此 看不懂快推
05/05 23:00, 19F

05/05 23:08, , 20F
大概可理解差異....
05/05 23:08, 20F

05/05 23:10, , 21F
jk神大推
05/05 23:10, 21F

05/05 23:17, , 22F
沒錯 就是這樣
05/05 23:17, 22F

05/05 23:29, , 23F
恩恩 根想得差不多
05/05 23:29, 23F

05/05 23:36, , 24F
神推 總記得看過情報可是找不到 看jk神闡釋就是爽!
05/05 23:36, 24F

05/05 23:38, , 25F
不知jk神可不可為普羅眾生預言一下maxwell!
05/05 23:38, 25F

05/05 23:51, , 26F
雖然看不懂 不過有神就要快推 orz
05/05 23:51, 26F

05/05 23:54, , 27F
推推~~~~
05/05 23:54, 27F

05/06 00:48, , 28F
推。
05/06 00:48, 28F

05/06 01:11, , 29F
PUSH PUSH
05/06 01:11, 29F

05/06 08:10, , 30F
...推呂布
05/06 08:10, 30F

05/06 13:48, , 31F
太深澳
05/06 13:48, 31F

05/06 22:23, , 32F
我看的懂火鳳那一段@_@
05/06 22:23, 32F

05/07 11:18, , 33F
喔喔喔 完全看不懂
05/07 11:18, 33F
文章代碼(AID): #1FfJNeD0 (PC_Shopping)