[心得] ECC和非ECC記憶體架Server

看板PC_Shopping作者 (春雨)時間3年前 (2021/02/03 11:56), 3年前編輯推噓29(29045)
留言74則, 32人參與, 3年前最新討論串1/1
以下要說的純屬個人經驗,並沒有經過比較明確的驗證或測試,也可能單純只是個案 故僅供參考 我自己本身有架Server 主網頁伺服器(IIS+PHP+MySQL) 偶爾跑些程式、Docker或Minecraft Server之類 原本使用E3-1231v3+ECC記憶體(C224晶片組) 用了幾年整體來說算很穩定 數次持續幾個月沒重開機也都維持正常 前陣子升級一下硬體 主機板換W480的 CPU使用i9-10900K 記憶體美光DDR4 2666 16G*2(有在QVL上) 由於基本上是個人使用 且感覺現在整體技術應該比較好 不用ECC應該沒差 原本系統是Server 2016 剛開始偷懶 直接clone到新硬碟上 但用一陣子 不時會出現BSOD重啟 想說 既然整個硬體更新 那還是重灌比較乾淨點 重灌系統-Server2019 但依然平均1-2天就一次BSOD重啟 查了log 錯誤代碼都是和Memory有關的 那就想 換個記憶體看看 換了海盜船的白金統治者 XMP可以跑3200 不過只是為了測試就沒開XMP跑預設2133 觀察一周 也出現了3次BSOD重啟的情況 這樣下去 感覺不太行 這頻率有點高 (從買主機板到現在也有更新BIOS 2次了 並沒有改善) 這時想到ECC的事情,於是就去買了顆Xeon W-1290P 加上2條DDR4 2666 ECC(QVL上) *W-1290P其實跟10900K規格幾乎一樣 差在能支援ECC記憶體 外觀 https://imgpoi.com/i/KB02TM.jpg
CPUZ跑分 https://imgpoi.com/i/KBQ1WV.png
https://imgpoi.com/i/KBQTNE.png
目前跑了2週多 還沒出現過BSOD的情況 不過由於沒測W-1290P+non ECC的穩定性 也不能排除之前BSOD是CPU的問題就是 雖然機率相對比較低 若真的是ECC的問題 那感覺ECC還是有存在的價值 現在intel為了市場區隔 消費級的CPU不支援ECC就有點坑了 AMD:選我選我 有空再測下ECC vs non-ECC的效能差距 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.7.152 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1612324602.A.730.html

02/03 12:01, 3年前 , 1F
ECC真的好 只是多10%價格就翻一倍 有夠不合理= =
02/03 12:01, 1F

02/03 12:03, 3年前 , 2F
non ECC的記憶體真的很容易出錯,要求穩定的話要
02/03 12:03, 2F

02/03 12:04, 3年前 , 3F
特別小心,像我手邊的機器配n-ecc ram都只能降頻跑
02/03 12:04, 3F

02/03 12:04, 3年前 , 4F
經手4.5台記憶體插滿都是只能跑2133,不然會有錯
02/03 12:04, 4F

02/03 12:05, 3年前 , 5F
等年底ddr5
02/03 12:05, 5F

02/03 12:05, 3年前 , 6F
而且是很詭異的錯誤,跑memtest86抓不太到的那種
02/03 12:05, 6F
我平常使用的電腦非ECC 使用時間很長 也幾乎沒出現過記憶體相關錯誤 不過可能就是因為Server上有比較持續大量的運算之類 以至於撞到錯誤的機率就提高了 ※ 編輯: Harusame (114.34.7.152 臺灣), 02/03/2021 12:09:03

02/03 12:06, 3年前 , 7F
特爾i3有支援ECC真的是很神奇的操作
02/03 12:06, 7F
所以很明顯就是i5 i7 i9 intel不是不做 是不給你用 i5 i7 i9各型號幾乎也都有規格相當對應的Xeon版本(就貴個40-50美元)

02/03 12:09, 3年前 , 8F
沒有一般消費市場來拉動的話,ECC要降價困難重重
02/03 12:09, 8F
※ 編輯: Harusame (114.34.7.152 臺灣), 02/03/2021 12:18:07

02/03 12:19, 3年前 , 9F
ECC就是讚 但是太貴了
02/03 12:19, 9F

02/03 12:19, 3年前 , 10F
尤其是大家電腦的記憶體容量越來越大
02/03 12:19, 10F

02/03 12:23, 3年前 , 11F
要用ECC直接買ryzen就好
02/03 12:23, 11F

02/03 12:24, 3年前 , 12F
non ECC跑安卓模擬器藍屏的機會也比較大 尤其分配
02/03 12:24, 12F

02/03 12:24, 3年前 , 13F
超過4g的時候
02/03 12:24, 13F

02/03 12:25, 3年前 , 14F
本人3C殺手,電腦常常當機,自從換了ECC ram 的電
02/03 12:25, 14F

02/03 12:25, 3年前 , 15F
腦後當機的問題變少了:)
02/03 12:25, 15F

02/03 12:25, 3年前 , 16F
ECC應該要是標配,就intel在搞人
02/03 12:25, 16F

02/03 12:26, 3年前 , 17F
除了被Windows更新搞的例外
02/03 12:26, 17F

02/03 12:28, 3年前 , 18F
垃圾intel 整天搞用戶
02/03 12:28, 18F

02/03 12:28, 3年前 , 19F
ECC頻率都不高,對於只想打電動的普通人來說沒啥用
02/03 12:28, 19F
其實也有原生2933和3200的 不過我這主機板QVL上只有2666的 所以就只買2666 主要是ECC沒人在做XMP吧 但真要自己超 應該也不是不行

02/03 12:28, 3年前 , 20F
用9900K+B365裝ESXi倒是沒什麼問題,虛擬機妥妥的
02/03 12:28, 20F

02/03 12:30, 3年前 , 21F
自然也就不會花錢去買這類產品,但普通人一定比專業
02/03 12:30, 21F

02/03 12:31, 3年前 , 22F
沒啥用不是沒支援的理由阿
02/03 12:31, 22F

02/03 12:31, 3年前 , 23F
淘寶EPYC 7X02和7X42系列價格都很香
02/03 12:31, 23F

02/03 12:31, 3年前 , 24F
AMD就有支援
02/03 12:31, 24F

02/03 12:31, 3年前 , 25F
有無ECC最好能差這麼多 三天兩頭BSOD = =
02/03 12:31, 25F
可能跟跑的東西有關 畢竟大量運算撞到錯誤可能性就上升 當然這個只是個人遇到的狀況 目前暫時也只是猜ECC的問題 也許有其他原因

02/03 12:31, 3年前 , 26F
用戶多,ECC能不能降價我覺得非常難...
02/03 12:31, 26F

02/03 12:31, 3年前 , 27F
ECC成本很低 沒降價主要還是利潤高吧
02/03 12:31, 27F
相當於非ECC的 9/8 成本可能就多12.5%左右

02/03 12:32, 3年前 , 28F
反正我下一台主機會組DDR5
02/03 12:32, 28F

02/03 12:32, 3年前 , 29F
不支援的理由就是INTEL和DRAM廠商要大賺特賺
02/03 12:32, 29F

02/03 12:32, 3年前 , 30F
廠商做超頻加個燈就賣得和ECC差不多錢了,普通用戶
02/03 12:32, 30F

02/03 12:33, 3年前 , 31F
其他硬體或相容性問題還高些 不然PC不就天天死機
02/03 12:33, 31F

02/03 12:33, 3年前 , 32F
也不是買不起,就市場上沒這麼受歡迎
02/03 12:33, 32F

02/03 12:33, 3年前 , 33F
沒有ECC真的蠻好笑的 電腦的其他傳輸過程基本上都加
02/03 12:33, 33F
※ 編輯: Harusame (114.34.7.152 臺灣), 02/03/2021 12:37:33

02/03 12:34, 3年前 , 34F
上了不同程度的錯誤校驗,但是主記憶體還沒有ECC
02/03 12:34, 34F

02/03 12:34, 3年前 , 35F
沒有ECC的問題只會越來越嚴重喔 XD
02/03 12:34, 35F

02/03 13:05, 3年前 , 36F
我自己架的網站和tinytinyrss這種輕應用的也沒再用
02/03 13:05, 36F

02/03 13:05, 3年前 , 37F
ECC
02/03 13:05, 37F

02/03 13:06, 3年前 , 38F
跟跑什麼有關細吧
02/03 13:06, 38F

02/03 13:14, 3年前 , 39F
輕度應用加上沒有24小時開機的人可能真的感覺不出來
02/03 13:14, 39F

02/03 13:15, 3年前 , 40F
但是記憶體不穩這種東西如果你有碰到就知道了
02/03 13:15, 40F

02/03 13:15, 3年前 , 41F
消費型PC真的就是不可靠,出問題機會高很多
02/03 13:15, 41F

02/03 13:16, 3年前 , 42F
應該是記憶體不相容比較有可能
02/03 13:16, 42F

02/03 13:17, 3年前 , 43F
記憶體controller這東西,沒有真的量個眼圖,你不
02/03 13:17, 43F

02/03 13:17, 3年前 , 44F
敢說他穩
02/03 13:17, 44F

02/03 13:30, 3年前 , 45F
意外?之前手上一堆一般文書機,拿來當伺服器,一年
02/03 13:30, 45F

02/03 13:30, 3年前 , 46F
增加20億筆,多用途也不曾當機,詭異。Win與Linux
02/03 13:30, 46F

02/03 13:30, 3年前 , 47F
都有,有有用VM等
02/03 13:30, 47F

02/03 13:30, 3年前 , 48F
記憶體還是雜牌的DDR3,DDR4
02/03 13:30, 48F

02/03 13:33, 3年前 , 49F
看運算類型, 如果當計算農場或build service
02/03 13:33, 49F

02/03 13:33, 3年前 , 50F
確實有可能發生Row hammer的問題
02/03 13:33, 50F

02/03 13:34, 3年前 , 51F
3C的就都這樣把它想成類似POWER的其中一層保護就好
02/03 13:34, 51F

02/03 13:57, 3年前 , 52F
沒ecc是真的沒價值
02/03 13:57, 52F

02/03 14:08, 3年前 , 53F
也有人沒ecc架server都跑n年了, 也有人用raspberry
02/03 14:08, 53F

02/03 14:08, 3年前 , 54F
pi架, 所以怎樣的狀況穩不穩一直是個謎...
02/03 14:08, 54F

02/03 14:25, 3年前 , 55F
如果不是跑成本高或是錯了也無所謂的運算 那ECC真的
02/03 14:25, 55F

02/03 14:26, 3年前 , 56F
微乎其微 除非來一次錯到引發蝴蝶效應聯系統都不穩
02/03 14:26, 56F

02/03 14:35, 3年前 , 57F
運算錯誤有那麼容易搞到BSOD嗎
02/03 14:35, 57F
所以我也覺得詭異 完全意料之外 我之前也有非ECC輕度Server的 也沒出事 當然可能根本就其他原因 要真的確定情況可能還要多試幾組不同RAM或CPU吧 ※ 編輯: Harusame (114.34.7.152 臺灣), 02/03/2021 14:40:20

02/03 14:40, 3年前 , 58F
運氣嘛
02/03 14:40, 58F

02/03 14:55, 3年前 , 59F
ecc ddr3 洋垃圾網拍一堆超便宜4GB一條150~200
02/03 14:55, 59F
ECC有分RDIMM和UDIMM 網拍那些應該是RDIMM就是ECC REG的 雖然算更高階 原價也更高 但由於一般消費級PC無法使用(要配合洋垃圾的中高階Xeon) 市場因素以至於更便宜 而ECC UDIMM跟一般non-ECC是相容的 在大部分環境還是可以通用 (就變成沒啟用ECC功能) 故若是ECC UDIMM的 還是會比同規格的non-ECC稍貴

02/03 14:57, 3年前 , 60F
呃…要ECC就是要更穩定的使用……
02/03 14:57, 60F
※ 編輯: Harusame (114.34.7.152 臺灣), 02/03/2021 15:08:42

02/03 15:16, 3年前 , 61F
ecc就是低cp值 有問題時可以不用去查ram的問題
02/03 15:16, 61F

02/03 15:18, 3年前 , 62F
Linux之父因為ecc支援問題噴過intel,但i皇就是傲
02/03 15:18, 62F

02/03 16:20, 3年前 , 63F
其實single bit error就資料錯 使用者不見得能察覺
02/03 16:20, 63F

02/03 16:20, 3年前 , 64F
搞到BSOD真的運氣很好
02/03 16:20, 64F

02/03 16:23, 3年前 , 65F
Hit rate這麼高 都剛好在critical區 搞不好你原本的
02/03 16:23, 65F

02/03 16:23, 3年前 , 66F
DIMM真的有無法回復的問題
02/03 16:23, 66F

02/03 16:47, 3年前 , 67F
Ryzen+ECC UDIMM路過 目前3200 CL22 64G
02/03 16:47, 67F

02/03 16:47, 3年前 , 68F
拿到好顆粒還是有機會超上去
02/03 16:47, 68F

02/03 16:47, 3年前 , 69F
但是時序壓不下來也不建議壓
02/03 16:47, 69F

02/03 17:47, 3年前 , 70F
能關ecc試一把看看?
02/03 17:47, 70F
這個之後想試試 也可以直接拿原本出錯的RAM配1290P 如果能至少先排除CPU問題比較完整 ※ 編輯: Harusame (114.34.7.152 臺灣), 02/03/2021 20:14:31

02/03 20:15, 3年前 , 71F
ECC不應該差這麼多 應該是有其他東西出問題
02/03 20:15, 71F

02/04 01:00, 3年前 , 72F
ECC應該要是標配+1,就Intel故意要區隔市場
02/04 01:00, 72F

02/04 09:15, 3年前 , 73F
推測試 看起來這兩顆根本兄弟,只是把i9 ecc封印?
02/04 09:15, 73F

02/04 09:15, 3年前 , 74F
這樣一切割,又可以多賣40美
02/04 09:15, 74F
文章代碼(AID): #1W6XxwSm (PC_Shopping)