CE-Fehler im Speicherprotokoll

CE-Fehler im Speicherprotokoll

Ich habe einen HP-Server (DL360-G7) und darauf läuft Centos7 + cPanel. In /var/log/message sehe ich diesen Fehler:

EDAC MC0: 5450 CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0

Ich ändere RAMs und Speichersteckplätze im Server, aber es besteht immer noch ein Fehler:

EDAC MC0: 25509 CE error on CPU#0Channel#0_DIMM#0 (channel:0 slot:0

wenn ich diesen Befehl ausführe:

grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count

Ich sehe diese Ausgabe:

/sys/geräte/system/edac/mc/mc0/csrow0/ch0_ce_count:5067071

/sys/geräte/system/edac/mc/mc1/csrow0/ch0_ce_count:0

Im ILO-Panel treten keine Fehler auf!

Was ist das Problem?

Antwort1

Aus den obigen Protokollen können wir schließen, dass es sich bei den Fehlern um korrigierbare Fehler handelt. (Kanal:1 Steckplatz:0 und Kanal:0 Steckplatz:0) bedeutet, dass 2 Kanäle Probleme haben (korrigierbare Probleme). Kanal ist ein Speichercontrollerkanal, der für die Kommunikation mit einer Gruppe von DIMMs verantwortlich ist. Jeder Kanal hat seinen eigenen unabhängigen Steuer- (Befehls-) und Datenbus und kann unabhängig oder in Gruppen mit anderen Kanälen verwendet werden. Sehen Sie sich diese Seite anhttps://www.kernel.org/doc/html/latest/driver-api/edac.html?highlight=edac#main-concepts-used-at-the-edac-subsystem. Wenn die Anzahl zu hoch ist, ersetzen Sie besser das DIMM und überprüfen Sie das Motherboard auf Hardwarefehler. Manchmal liegt das Problem nicht am DIMM, sondern am Motherboard selbst. Sie können eine niedrige Anzahl von CE-Fehlern ignorieren.

verwandte Informationen