[請益] 顯卡記憶體頻寬效用會否被DDR平均

看板VideoCard作者 (少n)時間8年前 (2015/10/06 01:05), 8年前編輯推噓8(8025)
留言33則, 7人參與, 最新討論串1/1
由於正在看繪圖卡 初階的quadrok系列和中高階的似乎主要差別在CUDA顆粒數 和記憶體大小頻寬 目前在未來組裝機上打算插滿32G的OC2400記憶體 利用XMP設定提高時脈 想請教這樣是否能提升顯卡的記憶體頻寬運作值呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.173.46.44 ※ 文章網址: https://www.ptt.cc/bbs/VideoCard/M.1444064716.A.180.html

10/06 01:13, , 1F
你要不要看看VRAM的頻寬是和誰在交流用的..
10/06 01:13, 1F

10/06 01:21, , 2F
難道你想做HSA?
10/06 01:21, 2F

10/06 01:45, , 3F
這就來去做功課@@
10/06 01:45, 3F

10/06 02:03, , 4F
NV雖然是說要達成統一記憶體定址 但在Maxwell這代還沒法完全
10/06 02:03, 4F

10/06 02:05, , 5F
實現 目前GPU一般情況下還是以存取VRAM為主
10/06 02:05, 5F

10/06 09:59, , 6F
10/06 09:59, 6F

10/06 09:59, , 7F
請問目前有沒有外插PCI卡可以直接做到HSA/FSA呢?
10/06 09:59, 7F

10/06 14:50, , 8F
跑2400時脈的系統記憶體對整體系統運作效率會有助益 但對於
10/06 14:50, 8F

10/06 14:53, , 9F
GPU在處理/存取VRAM上的資料效率不會有明顯提昇 不說3D成像
10/06 14:53, 9F

10/06 14:55, , 10F
你可先看看目前CUDA https://en.wikipedia.org/wiki/CUDA
10/06 14:55, 10F

10/06 14:56, , 11F
運算流程 當然 NV喊很久的 Unified Memory (統一記憶體)
10/06 14:56, 11F

10/06 14:58, , 12F
http://goo.gl/XKxuzx 會在CUDA 6達成 但目前Maxwell架構的
10/06 14:58, 12F

10/06 14:59, , 13F
顯卡似乎還是無法實際達成
10/06 14:59, 13F

10/06 15:03, , 14F
實際上目前系統記憶體的頻寬 差不多30GB/s 這相較於顯卡上的
10/06 15:03, 14F

10/06 15:05, , 15F
高速VRAM頻寬差距非常多 直接挑張規格高的顯卡(流處理器數、
10/06 15:05, 15F

10/06 15:06, , 16F
VRAM頻寬高) 會比較實際
10/06 15:06, 16F

10/06 18:01, , 17F
不過這樣的好處到底在哪邊阿? vRAM和sysRAM一定越差越大
10/06 18:01, 17F

10/06 18:06, , 18F
就算6通道3GHz,也才144GB/s可是HBM2之後vRAM都是>1TB/s的
10/06 18:06, 18F

10/06 18:58, , 19F
請問CUDA版本是否跟核心數沒有關聯呢?
10/06 18:58, 19F

10/06 19:12, , 20F
裡面有人說GXT 750ti會用到UndefinedMemory架構
10/06 19:12, 20F
*改成GTX 750ti

10/06 19:12, , 21F
是否有實現或正在實現的影子呢?
10/06 19:12, 21F

10/06 22:06, , 22F
無關 750Ti沒有用到吧? 你看哪邊寫的
10/06 22:06, 22F

10/06 23:00, , 23F
t大的第五行link裡面Mark Harris提到的
10/06 23:00, 23F

10/07 01:19, , 24F
有些CUDA會應用到的意思 你要看本文的應用
10/07 01:19, 24F

10/07 01:21, , 25F
不過基於同一個架構都差不多的情況下 這一代的應用不用
10/07 01:21, 25F

10/07 01:21, , 26F
太過於期待 而且支援的效果如何也是隻字未提 聽聽就好
10/07 01:21, 26F
※ 編輯: duckgentlema (218.173.46.44), 10/07/2015 08:28:23

10/07 09:38, , 27F
拿 APU 寫 OpenCL 就可以 zerocopy 啦
10/07 09:38, 27F

10/07 09:39, , 28F
你要寫 CUDA 就乖乖挑張記憶體大的,資料統統上顯卡
10/07 09:39, 28F

10/07 09:40, , 29F
RAM 快根本沒屁用,瓶頸是 PCI-E 通道
10/07 09:40, 29F

10/07 11:49, , 30F
請問PCI-E通道傳輸要看MB的數值嗎?
10/07 11:49, 30F

10/07 13:40, , 31F
總是要技術宣示一下 不然NV的潮度不夠
10/07 13:40, 31F

10/07 13:44, , 32F
pcie就2.0/3.0 x16 x8 x4 這樣啊
10/07 13:44, 32F

10/07 13:44, , 33F
這世代的幾乎都是3.0 然後通常一定有一條x16的
10/07 13:44, 33F
文章代碼(AID): #1M4gtC60 (VideoCard)