戴爾伺服器記憶體遇到多位錯誤

戴爾伺服器記憶體遇到多位錯誤

Dell OpenManage 報告了以下內容:

記憶體裝置狀態嚴重 記憶體裝置位置:DIMM_B2 可能的記憶體模組事件原因:遇到多位元錯誤

這是什麼意思?有多糟?

答案1

事件訊息參考是1404。它表明應該更換故障的 DIMM,但從我在部落格上讀到的內容來看,該警報通常會清除,並且在重新啟動後不會再次出現。因為它只給我絆倒過一次,所以我清除記憶體錯誤使用 OMSA (dcicfg32.exe) 到目前為止一切順利。

答案2

根據戴爾的說法,錯誤原因為:「內存設備糾正率超出了可接受的值,內存備用組已激活,或多位 ECC 錯誤發生。系統繼續正常運行(多位錯誤除外)。更換內存模組在系統下次定期維護期間,訊息中會提供儲存設備的狀態和位置。

嘗試以相同的 DIMM 取代該 DIMM。如果您的內存在保固期內,請向同一供應商購買更換零件。

相關內容