Re: [情報] Intel admits Ivy B chips run hotter
推 arrenwu:以 GTX680 的情況來看,6系列通用計算應該是大輸 5系列 05/04 00:59
推 cluohy75118: GK110 05/04 01:36
→ cluohy75118:架構問題我比較想看jk神闡釋 可以確定的是maxwell會是 05/04 01:36
→ cluohy75118:nv這幾年來真正想表現的最終型態 05/04 01:37
GTX680的GPGPU表現其實基於一個很簡單的原因......
Register:SP數量比以往減少很多.
G80/G92的時候,8個SP總共使用16,384個reg,GK104則是192個SP使用65,536個reg.
比例大概是從2,048降到341,足足少了6倍.
這邊要說明一下,register的數量和每個block(SMp)對應的thread數量有關.
假如CUDA程式設定成128個thread的話,在G80/G92上就是同一個thread下真正使用
到16,384/128=128個register,這樣每個SP平均有16個reg可以用.算是蠻寬裕的.
而thread拉長,就是可以有效的隱藏Video RAM存取的延遲
常態來說這個video RAM的延遲都是100出頭個cycle,不同卡會不太一樣
所以舊的CUDA程式要求效能會以64~256個thread為主流.假定最主流的是128個thread
的話...
那這個程式在GK104上,每個thread就是192個SP分配到512個register.
由於每個SP每個CYCLE都要二讀一寫........好啦 中間計算就省略一下.
一般而言指令要有良好的平行度,不會浪費太多時間在register allocation
的時候作spill out(專有名詞,register不夠用所以把舊的資料存入記憶體)
那麼register最好是ALU總數(GPU下的例子是SP)的6~8倍.低於這數值平行度就會
很差,比這高當然效能還會好一點,但高過16倍又不一定會看到好處...因此換算起來,
192個SP分配512個register,真正的利用率可能只有1/2~1/3...意思是
和96 or 64個SP的效能差不多
那麼GTX680的1536個SP,除以這比例就剩下768~512,再除以沒有hot clock
的計算量減半.結果GK104的GPGPU表現就可能和GF104差不多會是同時脈下同等級.
實際上GK104的時脈高了一點.應該會領先少許.但約只有gtx580的75%吧.
[呂布:當我不用分心在謀權之上,誰可以敢說在武力上穩勝過我]
這個問題不能說整個Kepler系列設計不重視GPGPU,應該是只有GK104如此
很有可能是因為GK104的定位可以讓他只專注在Graphics不要管GPGPU.
nVidia策略上作的到HD7900作不到的一件事情.一個產品當陳宮一個產品當呂布.
只要GK110的register:SP比例提高兩倍以上(當然這就無法在同面積內塞入相同數量的
SP,大量register非常的佔面積).這樣的晶片的GPGPU表現並不會差.當然可能Graphics
的表現就不會明顯領先一截了....
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.114.78.54
→
05/05 22:18, , 1F
05/05 22:18, 1F
推
05/05 22:18, , 2F
05/05 22:18, 2F
推
05/05 22:20, , 3F
05/05 22:20, 3F
推
05/05 22:25, , 4F
05/05 22:25, 4F
推
05/05 22:30, , 5F
05/05 22:30, 5F
推
05/05 22:31, , 6F
05/05 22:31, 6F
推
05/05 22:33, , 7F
05/05 22:33, 7F
推
05/05 22:34, , 8F
05/05 22:34, 8F
推
05/05 22:43, , 9F
05/05 22:43, 9F
推
05/05 22:43, , 10F
05/05 22:43, 10F
推
05/05 22:45, , 11F
05/05 22:45, 11F
推
05/05 22:46, , 12F
05/05 22:46, 12F
→
05/05 22:51, , 13F
05/05 22:51, 13F
→
05/05 22:52, , 14F
05/05 22:52, 14F
推
05/05 22:53, , 15F
05/05 22:53, 15F
推
05/05 22:54, , 16F
05/05 22:54, 16F
推
05/05 22:58, , 17F
05/05 22:58, 17F
推
05/05 23:00, , 18F
05/05 23:00, 18F
推
05/05 23:00, , 19F
05/05 23:00, 19F
推
05/05 23:08, , 20F
05/05 23:08, 20F
推
05/05 23:10, , 21F
05/05 23:10, 21F
→
05/05 23:17, , 22F
05/05 23:17, 22F
→
05/05 23:29, , 23F
05/05 23:29, 23F
推
05/05 23:36, , 24F
05/05 23:36, 24F
→
05/05 23:38, , 25F
05/05 23:38, 25F
推
05/05 23:51, , 26F
05/05 23:51, 26F
推
05/05 23:54, , 27F
05/05 23:54, 27F
推
05/06 00:48, , 28F
05/06 00:48, 28F
推
05/06 01:11, , 29F
05/06 01:11, 29F
推
05/06 08:10, , 30F
05/06 08:10, 30F
推
05/06 13:48, , 31F
05/06 13:48, 31F
推
05/06 22:23, , 32F
05/06 22:23, 32F
推
05/07 11:18, , 33F
05/07 11:18, 33F