Re: [閒聊] ECC記憶體究竟有多大用?NAS真的需要ECC
ecc 倒底有沒有用還真的很難說
最近出包老是同一地址,而且是 scrub 時抓到的
代表不是大量計算時發生,是閒閒沒事幹時抓到的
是這條有 defect 嗎? 還是我被駭了,有人在玩 rowhammer ?
https://i.imgur.com/1KHKE6b.png
![](https://i.imgur.com/1KHKE6b.jpg)
這台是 Zen3 出來時組的,第一年也都好好的,完全沒 ecc error
從看到 error 到現在也還沒動力去原屋買新的
畢竟不確定有沒有壞、懶得換、沒錢
所以可能沒有比 non ecc 好太多
因為弱點是 user 沒有錢好好維護
: 一方面是non ecc的情況下ZFS不會比其他檔案系統更不可靠
: 加上我有備份+資料重要程度不高
補充:
如果 ZFS 抓到 checksum 有問題的時候,是一點辦法也沒有的
和組 raid1,結果 raid1 兩顆硬碟中因為有 bitrot 導致資料不一致一樣
兩者都無法自我修複,同時有 checksum + 備份才可以修複
(要有 raid 或 replica 才行)
換句話說,單純使用 ZFS 和單純使用 raid1 是一樣的,都無法解決 bitrot 的問題
請確定你的 ZFS 的設定有符合你的期待
而所有有 checksum + (parity / replica / raid) 的方案都不會比 ZFS 差
: 我覺得non ecc在家用場景下對資料安全性的風險有點被誇大了
: 當預算有限的情況下,投資備援or備份設備 可能會是CP值更大的選擇
如果 ecc 是都市傳說,那 bitrot 可能更是都市傳說
並不是說 ZFS 沒用,而是 ZFS 抓到資料有問題的時候幾乎都不是 bitrot
而是硬碟有壞軌了,或硬碟怎樣了,基本上都嚴重到 smart 會有紀錄
至少我 snapraid scrub 每次抓到錯誤都是壞軌,沒有 slient error
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.141.57.57 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1655099070.A.183.html
推
06/13 13:55,
2年前
, 1F
06/13 13:55, 1F
→
06/13 13:56,
2年前
, 2F
06/13 13:56, 2F
推
06/13 13:58,
2年前
, 3F
06/13 13:58, 3F
→
06/13 13:59,
2年前
, 4F
06/13 13:59, 4F
→
06/13 14:00,
2年前
, 5F
06/13 14:00, 5F
推
06/13 14:03,
2年前
, 6F
06/13 14:03, 6F
推
06/13 14:04,
2年前
, 7F
06/13 14:04, 7F
推
06/13 14:08,
2年前
, 8F
06/13 14:08, 8F
推
06/13 14:10,
2年前
, 9F
06/13 14:10, 9F
→
06/13 14:10,
2年前
, 10F
06/13 14:10, 10F
→
06/13 14:10,
2年前
, 11F
06/13 14:10, 11F
→
06/13 14:10,
2年前
, 12F
06/13 14:10, 12F
→
06/13 14:10,
2年前
, 13F
06/13 14:10, 13F
推
06/13 14:14,
2年前
, 14F
06/13 14:14, 14F
→
06/13 14:14,
2年前
, 15F
06/13 14:14, 15F
→
06/13 14:14,
2年前
, 16F
06/13 14:14, 16F
→
06/13 14:15,
2年前
, 17F
06/13 14:15, 17F
→
06/13 14:15,
2年前
, 18F
06/13 14:15, 18F
→
06/13 14:16,
2年前
, 19F
06/13 14:16, 19F
→
06/13 14:17,
2年前
, 20F
06/13 14:17, 20F
其實不是,是靠 snapraid 的 checksum 和 parity 在確保資料安全
smart 只是其它額外資訊
→
06/13 14:18,
2年前
, 21F
06/13 14:18, 21F
→
06/13 14:18,
2年前
, 22F
06/13 14:18, 22F
→
06/13 14:18,
2年前
, 23F
06/13 14:18, 23F
→
06/13 14:19,
2年前
, 24F
06/13 14:19, 24F
→
06/13 14:19,
2年前
, 25F
06/13 14:19, 25F
推
06/13 14:22,
2年前
, 26F
06/13 14:22, 26F
→
06/13 14:22,
2年前
, 27F
06/13 14:22, 27F
→
06/13 14:22,
2年前
, 28F
06/13 14:22, 28F
→
06/13 14:22,
2年前
, 29F
06/13 14:22, 29F
推
06/13 14:28,
2年前
, 30F
06/13 14:28, 30F
→
06/13 14:28,
2年前
, 31F
06/13 14:28, 31F
推
06/13 15:13,
2年前
, 32F
06/13 15:13, 32F
→
06/13 15:13,
2年前
, 33F
06/13 15:13, 33F
→
06/13 15:13,
2年前
, 34F
06/13 15:13, 34F
→
06/13 15:13,
2年前
, 35F
06/13 15:13, 35F
→
06/13 15:14,
2年前
, 36F
06/13 15:14, 36F
→
06/13 15:14,
2年前
, 37F
06/13 15:14, 37F
推
06/13 15:35,
2年前
, 38F
06/13 15:35, 38F
→
06/13 15:35,
2年前
, 39F
06/13 15:35, 39F
拿防當機來廣告 ecc 真的是很不好的宣傳
和資料不正確比起來,當機其實不是壞事
很多主機板可以設定 uncorrectable ecc error 時 mce 要不要報錯給系統
linux kernel 也可以設定 uncorrectable ecc error 發生時 "要不要當機"
是的,記憶體有錯的時候,是不一定會當機的,而且通常是不會當機的
那為什麼 kernel 要預設 uncorrectable ecc error 時要故意讓它當機?
因為錯誤的資料比當機更可怕
比如記憶體出包導致檔案系統掛掉有沒有可能?
※ 編輯: HamalAri (220.141.57.57 臺灣), 06/13/2022 15:52:24
→
06/13 15:56,
2年前
, 40F
06/13 15:56, 40F
→
06/13 15:58,
2年前
, 41F
06/13 15:58, 41F
推
06/13 16:35,
2年前
, 42F
06/13 16:35, 42F
→
06/13 16:35,
2年前
, 43F
06/13 16:35, 43F
推
06/13 22:54,
2年前
, 44F
06/13 22:54, 44F
→
06/13 22:54,
2年前
, 45F
06/13 22:54, 45F
→
06/13 22:54,
2年前
, 46F
06/13 22:54, 46F
→
06/13 22:54,
2年前
, 47F
06/13 22:54, 47F
→
06/13 22:54,
2年前
, 48F
06/13 22:54, 48F
→
06/13 22:55,
2年前
, 49F
06/13 22:55, 49F
→
06/13 22:56,
2年前
, 50F
06/13 22:56, 50F
推
06/14 18:33,
2年前
, 51F
06/14 18:33, 51F
討論串 (同標題文章)