Error CE activado en el registro de memoria

Error CE activado en el registro de memoria

Tengo un servidor HP (DL360-G7) y en él ejecuto Centos7 + cPanel. en /var/log/message veo este error:

EDAC MC0: 5450 CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0

Cambio las RAM y las ranuras de memoria en el servidor, pero todavía existe un error:

EDAC MC0: 25509 CE error on CPU#0Channel#0_DIMM#0 (channel:0 slot:0

cuando ejecuto este comando:

grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/ch*_ce_count

Veo este resultado:

/sys/devices/system/edac/mc/mc0/csrow0/ch0_ce_count:5067071

/sys/devices/system/edac/mc/mc1/csrow0/ch0_ce_count:0

¡En el panel de la OIT hay algún error!

¿Cuál es el problema?

Respuesta1

De los registros anteriores podemos decir que los errores son errores corregibles, de (canal:1 ranura:0 y canal:0 ranura:0) significa que 2 canales tienen problemas (problemas corregibles). El canal es un canal controlador de memoria, responsable de comunicarse con un grupo de DIMM. Cada canal tiene su propio control (comando) y bus de datos independiente, y puede usarse de forma independiente o agruparse con otros canales. Consulta esta páginahttps://www.kernel.org/doc/html/latest/driver-api/edac.html?highlight=edac#main-concepts-used-at-the-edac-subsystem. Si el recuento es demasiado alto, es mejor reemplazar el DIMM y verificar la placa base para detectar errores de hardware; en ocasiones, el problema no está en el DIMM y puede estar en la propia placa. Puede ignorar el recuento bajo de errores CE.

información relacionada