Fw: [情報] AMD 講解HBM的優勢

看板PC_Shopping作者 (ATMOS)時間9年前 (2015/05/21 20:24), 編輯推噓36(36058)
留言94則, 32人參與, 最新討論串1/1
※ [本文轉錄自 VideoCard 看板 #1LNSvQbd ] 作者: MSA0120 (ATMOS) 看板: VideoCard 標題: [情報] AMD 講解HBM的優勢 時間: Thu May 21 20:23:51 2015 轉自 http://news.mydrivers.com/1/431/431040_all.htm#2 據介紹,AMD從事HBM技術研發已經長達7年了,與包括SK海力士在內的眾多業界夥伴一起 完成了這種新一代顯存。AMD方面的負責人是Bryan Black,過去7年的時間他基本都投身 在了HBM的研發上,是一位很有勇氣的工程師。 下邊,我們先通過幻燈片瞭解一下HBM的台前幕後,在解答一些熱點問題。 http://i.imgur.com/8xrn51B.jpg
首先是HBM顯存的必要性。目前主流的顯存規格是GDDR5,經過多年的使用和發展已經進入 了瓶頸期,迫切需要新的替代技術。 對於任何半導體產品而言,性能和功耗都是一對矛盾體,包括顯卡。如果顯卡整體功耗限 定,那麼GPU、顯存兩部分就必須互相妥協,而如今GDDR5顯存的規格越來越高,功耗也水 漲船高,導致留給GPU的功耗空間減少,必然影響性能提升。 http://i.imgur.com/MXTFkHt.jpg
一個關鍵問題就是顯存帶寬,它卻決於顯存的位寬和頻率。位寬都是GPU決定的,太高了 會嚴重增大GPU芯片面積和功耗,所以高端顯卡一直停留在384/512位。同時,GDDR5的頻 率已經超過7GHz,提升空間不大了。 http://i.imgur.com/8BFKBko.jpg
另外,GDDR5(包括以前的顯存)都面臨著「佔地面積」的問題。一大堆顯存顆粒圍繞在GPU 芯片周圍,這已經是固定模式,GDDR5再怎麼縮小也無法改變,而且已經不可能再繼續大 幅度縮小了。 http://i.imgur.com/1gcROmI.jpg
那麼,將DRAM集成到SoC處理器內部如何呢?目前看得 不償失,性能、功耗、尺寸、工藝都是很大的限制,無法獲得足夠的效益,短期內還必須 相對獨立。 http://i.imgur.com/NkRYW5Z.jpg
所以合理的下一步解決方案就是「中介層」(Interposer),讓DRAM儘可能接近GPU芯片, 封裝在同一基板上,提高通信能力。 於是,AMD聯合ASE、Amkor、聯電等夥伴聯合開發了第一個可以批量生產的中介層方案, 用到了HBM顯存上。 http://i.imgur.com/ovpN7FF.jpg
這就是AMD HBM方案的側面剖視圖。這一方案是基於AMD 、海力士聯合定義、研發的第一個完整規範和原型。 橙色部分就是HBM顯存的Die,3D立體封裝,多個Die(目前最多四個)垂直堆疊在一起,通 過TSV硅穿孔和micro-bumps微凸點技術彼此連接。藍色部分是邏輯Die,是一個內外通信 接口。 注意,每一個HBM Die都垂直與底部的邏輯Die進行通信,彼此之間是沒有任何聯繫的。 灰色部分是中介層(Interposer),是整個方案的通信員,將HBM顯存與GPU(也可以是 CPU/SoC)同構PHY物理層聯繫在一起,同時把它們都固定在封裝基板上。 HBM顯存本身是真正的3D封裝,而整個方案是2.5D封裝。 http://i.imgur.com/eVnkbwI.jpg
看這張更有立體感的圖,可以更好地理解HBM的3D結構。 http://i.imgur.com/pq2zqPH.jpg
HBM如其名,最大的特點就是高帶寬(確切地說是高位寬),目前已經可以做到單個顆粒 1024-bit,GDDR5的足足32倍。顯存帶寬與位寬、頻率都成正比,因此位寬上去了,頻率 就不用那麼高了,HBM目前的有效頻率僅僅1GHz,GDDR5的七分之一。 就這樣,HBM每個堆棧的帶寬可以突破100GB/s,GDDR5的四五倍。 更關鍵的是,HBM的電壓要求僅僅1.3V,低於GDDR5 1.5V,更加的節能。 http://i.imgur.com/fguvNHT.jpg
帶寬高了,功耗低了,能效自然非常突出,HBM每瓦特可提供35+GB/s的帶寬,GDDR5則只 能勉強超過10GB/s,高下立判。 http://i.imgur.com/rGm03GJ.jpg
http://i.imgur.com/xkLYtzz.jpg
同時,HBM體積小巧,非常節省空間,四層堆疊的1GB HBM只需要5×7=35毫米,而且是圍 繞著GPU核心統一封裝,不佔用PCB電路板。 1GB GDDR5則需要24×28=672平方毫米,還得算上封裝針腳,而且都是分佈在PCB上的。 因此從GDDR5換到HBM,顯卡的面積可以縮小一半以上。 以下是熱點問題解答: 問:HBM顯存與GPU核心未來是否會完全整合到一起? Joe Macri:肯定會的。現在它們是2.5D封裝,是目前比較合理的解決方案。完全的3D整 合封裝我們還在研究之中。對於手機等應用領域來說,這樣做會更適合(所佔面積更小)。 3D封裝可以實現,但是成本會上升,性能上也不會帶來大幅提升,或者其他明顯的好處。 問:HBM顯存會比GDDR5增加多少成本? Joe Macri:這個不能具體說增加多少,但是有了HBM,我們可以推出更有價格競爭優勢的 顯卡。 問:HBM是否也會用到中低端顯卡上? Joe Macri:會的。HBM和GDDR5類似,最初主要針對高端市場,之後慢慢就會覆蓋到中端 市場。HBM的普及速度還得看行業競爭。如果整個生態都用HBM,再加上它特有的能力,普 及肯定會很快。 問:網傳AMD會推出配備HBM顯存的高性能計算APU,是真的嗎? Joe Macri:我們可以看到,APU正在越來越強大。對於AMD來說,GPU、APU都會使用HBM, 這只是個時間問題。HBM其實並不僅限於顯卡,高性能計算、超級計算機、通信基礎設備 、服務器、PC等等都可以用。 問:AMD率先使用了HBM,而新技術總是機遇與挑戰並存,AMD是如何考慮的? Joe Macri:AMD的一個原則就是,我們發現了問題,我們就要去解決問題,提供解決方案 。比如說,我們把內存控制器集成到了處理器內部,我們推出了HSA異構系統架構。AMD喜 歡創新,也不怕競爭對手複製。我們認為,推廣HBM和當年我們推廣GDDR5是一樣的。 招喚obov大~~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.98.146 ※ 文章網址: https://www.ptt.cc/bbs/VideoCard/M.1432211034.A.967.html ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: MSA0120 (36.231.98.146), 05/21/2015 20:24:18

05/21 20:26, , 1F
別再搞PPT啦,快把卡拿出來跑分...
05/21 20:26, 1F

05/21 20:27, , 2F
XDD
05/21 20:27, 2F

05/21 20:31, , 3F
AMD在PowerPoint的支援度是最高呢
05/21 20:31, 3F

05/21 20:31, , 4F
開高解析度 開高反鋸齒時應該會很有優勢
05/21 20:31, 4F

05/21 20:34, , 5F
不過離應用應該還要三五年之後吧?
05/21 20:34, 5F

05/21 20:35, , 6F
就怕跟打樁機 推土機一樣 都跑不贏外星跑車= =
05/21 20:35, 6F

05/21 20:36, , 7F
6月要發表的390系列就會用上了
05/21 20:36, 7F

05/21 20:41, , 8F
他們slide做得真的很好看
05/21 20:41, 8F

05/21 20:42, , 9F
AMD真該和PowerPoint綁在一起做促銷 ((大誤
05/21 20:42, 9F

05/21 20:57, , 10F
圖好小給箭頭
05/21 20:57, 10F

05/21 21:45, , 11F
這麼威不拿出來用在Godavari
05/21 21:45, 11F

05/21 21:46, , 12F
godavari 那什麼爛東西
05/21 21:46, 12F

05/21 21:49, , 13F
AMD現在的一舉一動不過就是在挽救股價跟市值罷了 ZZ
05/21 21:49, 13F

05/21 21:51, , 14F
把東西整合進去後,就代表以後板廠可以玩的東西再少
05/21 21:51, 14F

05/21 21:52, , 15F
一樣,只會越來越無聊。
05/21 21:52, 15F

05/21 22:23, , 16F
看起來真的有戲唱~但是也得快點生出來呀...
05/21 22:23, 16F

05/21 22:28, , 17F
好想去學AMD的簡報技巧
05/21 22:28, 17F

05/21 23:11, , 18F
我比較在意你價錢要不要跳水
05/21 23:11, 18F

05/21 23:20, , 19F
看沒幾行就看到'幻燈片'
05/21 23:20, 19F

05/21 23:31, , 20F
3DIC的技術出來好久,現在終於等到實際應用了...
05/21 23:31, 20F

05/21 23:37, , 21F
如果沒有amd 可能現在顯存還在ddr3
05/21 23:37, 21F

05/21 23:39, , 22F
這種架構翻新往往是推動效能增長最大的動力
05/21 23:39, 22F

05/21 23:39, , 23F
也nvidia勢必要提早端出牛肉
05/21 23:39, 23F

05/21 23:40, , 24F
有人或許會砲說不定連980ti都打不贏
05/21 23:40, 24F

05/21 23:41, , 25F
但980TI有辦法搞短卡搞半高卡嗎 ?
05/21 23:41, 25F

05/21 23:43, , 26F
巴掌大的電腦也有中階顯卡效能時代來臨
05/21 23:43, 26F

05/21 23:44, , 27F
BRIX其中有一款採用桌上版GTX760...只是會過熱
05/21 23:44, 27F

05/21 23:50, , 28F
製程只要再推進一些就能看到brix有970效能
05/21 23:50, 28F

05/21 23:51, , 29F
如果依照目前做法,顯存就佔據很多空間還要考慮散熱
05/21 23:51, 29F

05/21 23:53, , 30F
這架構還有一個重點那就是apu若採用HBM
05/21 23:53, 30F

05/21 23:54, , 31F
那內顯都能有750Ti效能也不是不可能
05/21 23:54, 31F

05/22 00:12, , 32F
即便390X還不錯 也很快會被NV追上…時程上太慢了
05/22 00:12, 32F

05/22 00:15, , 33F
應該說 NV擁有那麼多資源還能被超越到底在幹嘛吧?
05/22 00:15, 33F

05/22 00:17, , 34F
HBM或HMC的記憶體 NV在2016年的Pascal架構也會使用
05/22 00:17, 34F

05/22 00:22, , 35F
HMC目前沒有要採用
05/22 00:22, 35F

05/22 00:40, , 36F
HBM發熱量又不會消失 只是集中而已 一樣要考慮散熱
05/22 00:40, 36F

05/22 00:40, , 37F
AMD果然是簡報一流!好想學XD
05/22 00:40, 37F

05/22 00:47, , 38F
市佔率崩成這樣實在看不出AMD哪裡超越
05/22 00:47, 38F

05/22 00:48, , 39F
技術上或許是第一家採用HBM 那也只是打敗NV將近一年
05/22 00:48, 39F

05/22 00:49, , 40F
前的科技 明年16nm就要上了 390X威也沒威多久
05/22 00:49, 40F

05/22 00:49, , 41F
更別說3系列除了390/390X以外 全線都是馬甲卡
05/22 00:49, 41F

05/22 00:50, , 42F
要靠3系列救回市佔率 我覺得很難……頂多微增到持平
05/22 00:50, 42F

05/22 00:51, , 43F
撐到NV Pascal出來再崩一次這樣……
05/22 00:51, 43F

05/22 00:54, , 44F
只要微增 AMD就能撐很久了
05/22 00:54, 44F

05/22 00:55, , 45F
說微增其實沒信心啦 會買頂級卡的人根本是少數
05/22 00:55, 45F

05/22 00:56, , 46F
市佔率大戶中高階到中階卡 全部都是舊的 怎麼拼阿
05/22 00:56, 46F

05/22 00:59, , 47F
這就跟價格有關了
05/22 00:59, 47F

05/22 01:00, , 48F
之前390會被預期看好的點也是在價位
05/22 01:00, 48F

05/22 01:01, , 49F
核心那麼大 成本比不過NV 要殺價一起殺還是GG
05/22 01:01, 49F

05/22 01:11, , 50F
之前的預測是fiji價位在980但可以拿來打gm200
05/22 01:11, 50F

05/22 01:12, , 51F
如果預測是真的 980ti殺價就直接取代980了
05/22 01:12, 51F

05/22 01:13, , 52F
不過東西不出來說什麼都沒意義
05/22 01:13, 52F

05/22 01:39, , 53F
這散熱一定有問題 不然不會只有1G
05/22 01:39, 53F

05/22 03:46, , 54F
不過縮減VRAM面積拿290X來對比也是個笑話
05/22 03:46, 54F

05/22 03:48, , 55F
自己用2Gb顆粒導致才4GB就要16顆在那說太佔空間
05/22 03:48, 55F

05/22 03:50, , 56F
Titan X用上8Gb顆粒12GB只要12顆 雖然成本有其考量
05/22 03:50, 56F

05/22 03:53, , 57F
但硬要這樣對比是覺得看得人太好騙嗎
05/22 03:53, 57F

05/22 05:18, , 58F

05/22 07:40, , 59F
to lsslss:290X用到16顆記憶體顆粒,是因為要湊到
05/22 07:40, 59F

05/22 07:42, , 60F
512Bit帶寬,一顆記憶體帶寬為32Bit
05/22 07:42, 60F

05/22 07:47, , 61F
而Titan X為384Bit帶寬,因此要湊12顆記憶體顆粒
05/22 07:47, 61F

05/22 08:16, , 62F
樓上正解
05/22 08:16, 62F

05/22 08:20, , 63F
不要鬧了好嗎....titan x 是 24 顆
05/22 08:20, 63F

05/22 08:26, , 64F
還有用R9 290X 是因為他是 512bit vs. 4096bit
05/22 08:26, 64F

05/22 08:26, , 65F
重點在記憶體寬度的比較又不是在跟你容量比較
05/22 08:26, 65F

05/22 10:49, , 66F
希望能讓n卡快點降價,A卡太弱,就沒便宜的n卡能
05/22 10:49, 66F

05/22 11:37, , 67F
AMD 拿高端顯卡試水溫,很期待 HBM 的效能,應該是
05/22 11:37, 67F

05/22 11:37, , 68F
不錯才對。
05/22 11:37, 68F

05/22 12:40, , 69F
TitanX記得是正12 背12 共24顆4Gb的Hynix GDDR5
05/22 12:40, 69F

05/22 13:28, , 70F
這個捲毛頭我以前常常看到耶 原來還在
05/22 13:28, 70F

05/22 13:33, , 71F
我覺得不要對pascal期待太多比較好 同價位
05/22 13:33, 71F

05/22 13:34, , 72F
效能大概不會好多少 省電是真的
05/22 13:34, 72F

05/22 13:34, , 73F
nv可以排到多少GG的產能才是最大問題
05/22 13:34, 73F

05/22 13:49, , 74F
obov:身寸惹 QQ
05/22 13:49, 74F

05/22 14:08, , 75F
請問我剛上大學換新電腦將時常用ppt做報告,請問用i
05/22 14:08, 75F

05/22 14:08, , 76F
ntel是不是比較難跑ppt ?
05/22 14:08, 76F

05/22 15:15, , 77F
忘記還有頻寬因素 真是非常抱歉
05/22 15:15, 77F

05/22 15:20, , 78F
一。總地說:就是用封裝$ 換效能
05/22 15:20, 78F

05/22 15:21, , 79F
不便宜,而且須要找到有效益的中介層材質
05/22 15:21, 79F

05/22 15:22, , 80F
二。三星研究封裝很久了,甚至TSMC也跟進研究了
05/22 15:22, 80F

05/22 15:22, , 81F
可能三星已經累積了某些優勢,對台灣是個挑戰
05/22 15:22, 81F

05/22 15:24, , 82F
三。看過一篇測試:記憶體佔NB耗電約25%
05/22 15:24, 82F

05/22 15:25, , 83F
這種技術,越低功耗裝置越須要,桌機差別不大。
05/22 15:25, 83F

05/22 15:49, , 84F
請問Titan X用24記憶體顆粒如何湊成384-Bit啊?
05/22 15:49, 84F

05/22 15:50, , 85F
是兩顆記憶體顆粒共用32-Bit帶寬嗎?
05/22 15:50, 85F

05/22 16:11, , 86F
應該是採用clamshell mode,不能貼網址請自行Google
05/22 16:11, 86F

05/22 16:13, , 87F
搜尋Titan X, Clamshell, 12 GB
05/22 16:13, 87F

05/22 17:06, , 88F
#1KkECf17 clamshell,不是什麼新奇玩意
05/22 17:06, 88F

05/22 18:06, , 89F
採用 GDDR5 Clamshell (x16) Modes 下去跑,通常
05/22 18:06, 89F

05/22 18:13, , 90F
有 Normal (x32) 與 Clamshell (x16) 模式,採用後
05/22 18:13, 90F

05/22 18:16, , 91F
者 (記憶體設計) 會跟另一邊記憶體共用同個記憶體
05/22 18:16, 91F

05/22 18:17, , 92F
控制器的位址與命令,查 H5GQ4H24MFR-R2C x16 就
05/22 18:17, 92F

05/22 18:18, , 93F
知道了。
05/22 18:18, 93F

05/23 10:49, , 94F
512Bit的GTX285現在還能幹嘛!?
05/23 10:49, 94F
文章代碼(AID): #1LNSvpZV (PC_Shopping)