[閒聊] CPU 跨 Core 延遲測試

看板PC_Shopping作者 (Sky)時間3年前 (2022/09/19 11:37), 3年前編輯推噓13(13022)
留言35則, 17人參與, 3年前最新討論串1/1
https://github.com/nviennot/core-to-core-latency https://news.ycombinator.com/item?id=32889337 在 Hacker news 看到 CPU 跨 Core 延遲測試工具。 Github 上可以看到結果,基本上和設計上的限制一樣 Intel 12th 有趣的是 CPU 8 (P-core?) 到任一個 Core 都很快 E-Core 之間傳輸比 P-core 相對慢一點 AMD EPYC 7R13 是8個 core 一組再連接起來, 因此跨 group 的延遲從 23ns 變成 110ns 而 AWS Graviton2 是一個大 Arm 晶片, 64 Core 之間延遲都差不多 Hacker News 上有 Apple M1 Pro 的結果: https://news.ycombinator.com/item?id=32892164 同樣可以看出是分成 4+4+2 三組 但跨 group 延遲比 AMD 高 0 59 231 205 206 206 208 219 210 210 59 0 205 215 207 207 209 209 210 210 231 205 0 40 42 43 180 222 224 213 205 215 40 0 43 43 212 222 213 213 206 207 42 43 0 44 182 227 217 217 206 207 43 43 44 0 215 215 217 217 208 209 180 212 182 215 0 40 43 45 219 209 222 222 227 215 40 0 43 43 210 210 224 213 217 217 43 43 0 44 210 210 213 213 217 217 45 43 44 0 -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.235.116 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1663558666.A.48F.html ※ 編輯: SkyPlus (140.113.235.116 臺灣), 09/19/2022 11:45:19

09/19 12:14, 3年前 , 1F
好的 英特爾又贏了一次
09/19 12:14, 1F

09/19 12:14, 3年前 , 2F
記憶體控制器也會有延遲
09/19 12:14, 2F

09/19 12:21, 3年前 , 3F
細膩
09/19 12:21, 3F

09/19 12:33, 3年前 , 4F
膠水延遲
09/19 12:33, 4F

09/19 12:46, 3年前 , 5F
intel延遲贏這在zen剛出的時候就知道了
09/19 12:46, 5F

09/19 12:47, 3年前 , 6F
後來蘇媽有改一版infinity fabric但還是輸一點
09/19 12:47, 6F

09/19 12:48, 3年前 , 7F
但intel付出的代價也不小,server晶片的die size跟
09/19 12:48, 7F

09/19 12:48, 3年前 , 8F
價格都壓不下
09/19 12:48, 8F

09/19 12:48, 3年前 , 9F
09/19 12:48, 9F

09/19 12:56, 3年前 , 10F
良率跟成本還是蘇媽贏啊
09/19 12:56, 10F

09/19 12:57, 3年前 , 11F
使用者不太需要去考慮這麼細的事情吧
09/19 12:57, 11F

09/19 12:57, 3年前 , 12F
最後整體跑出來多快才是使用者要的
09/19 12:57, 12F

09/19 12:58, 3年前 , 13F
牙膏13還是14gen P跟E溝通也有改進
09/19 12:58, 13F

09/19 12:59, 3年前 , 14F
Zen3八核內看起來延遲
09/19 12:59, 14F

09/19 12:59, 3年前 , 15F
不錯,但超過就暴增了
09/19 12:59, 15F

09/19 13:01, 3年前 , 16F
就有沒有跨CCX的差別阿 只是單純的MCM要多快也難拉
09/19 13:01, 16F

09/19 13:06, 3年前 , 17F
牙膏big.LITTLE還有很大的優化空間,big.LITTLE會
09/19 13:06, 17F

09/19 13:06, 3年前 , 18F
拖累大核的latency,但不至於會高14ns
09/19 13:06, 18F

09/19 13:12, 3年前 , 19F
13Gen好像有正常了 但是E core內部的交換反而慢
09/19 13:12, 19F

09/19 13:14, 3年前 , 20F
https://bit.ly/3ScstRz 小核叢集內慢是本來就有 13Gen
09/19 13:14, 20F

09/19 13:14, 3年前 , 21F
沒改善 但大到小看起來沒啥問題了
09/19 13:14, 21F

09/19 13:28, 3年前 , 22F
小笨賢:貼核,卡卡,numa
09/19 13:28, 22F

09/19 13:40, 3年前 , 23F
因為小核內沒snoop filter
09/19 13:40, 23F

09/19 13:42, 3年前 , 24F
因為10ff GMT妥協了不少東西
09/19 13:42, 24F

09/19 13:58, 3年前 , 25F
可憐那
09/19 13:58, 25F

09/19 15:33, 3年前 , 26F
優文
09/19 15:33, 26F

09/19 17:21, 3年前 , 27F
牙膏那個能算是big little嗎?
09/19 17:21, 27F

09/19 17:52, 3年前 , 28F
算呀,都特地設計了一個MCU來分配執行緒了
09/19 17:52, 28F

09/19 18:10, 3年前 , 29F
英特爾的小核是中核
09/19 18:10, 29F

09/19 18:35, 3年前 , 30F
那叫Big Midium好了,簡稱BM
09/19 18:35, 30F

09/20 09:30, 3年前 , 31F
從延遲看起來還是主要侷限在物理結構層面,如果amd
09/20 09:30, 31F

09/20 09:30, 3年前 , 32F
跨ccx延遲能壓到跟intel 12代水準,或是intel 的整體
09/20 09:30, 32F

09/20 09:30, 3年前 , 33F
延遲能跟amd 單ccx延遲一樣那才是有趣
09/20 09:30, 33F

09/20 09:37, 3年前 , 34F
AMD要壓也不難 2.5D下去就好了 牙膏14 Gen就不鳥成本直
09/20 09:37, 34F

09/20 09:38, 3年前 , 35F
接2.5D AMD大概還要等GG封裝有CP值才會大量用2.5D吧
09/20 09:38, 35F
文章代碼(AID): #1Z9-GAIF (PC_Shopping)