FreeNAS recibe errores de paridad/CRC incorregibles

FreeNAS recibe errores de paridad/CRC incorregibles

En mi instalación de FreeNAS 9.3 recibo cada vez más errores de paridad/CRC incorregibles (como estos aquí:

May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 b8 0e 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): Retrying command
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 68 10 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): Retrying command
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): READ_FPDMA_QUEUED. ACB: 60 00 18 12 18 40 91 00 00 01 00 00
May 15 13:39:41 freenas (ada1:ahcich1:0:0:0): CAM status: Uncorrectable parity/CRC error

Al principio cambié dos discos con estas menciones, pero ahora uno de mis discos más nuevos (en otro puerto) también los recibe. Así que estoy realmente seguro de que esta unidad no tiene ningún problema.

¿Qué puede causar estos errores? No tenemos ECC Ram en este servidor...

En SMART Log no hay nada que indique problemas, por lo que estoy confundido:

197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0


SMART Error Log Version: 1                                
No Errors Logged

SMART Self-test log structure revision number 1           
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      2398         -

Respuesta1

Tienes un fallo en el disco, controlador o cable.

No ha proporcionado ningún detalle sobre el hardware involucrado en esta solución. No es un problema de RAM, pero trátelo como cualquier otro esfuerzo de solución de problemas:

  • Esto está afectando a varios discos.
  • Los informes SMART en los discos no muestran errores... PerosonSATA...
  • ¿Investigar cómo están conectados los discos? ¿A través del backplane? ¿A través de cables de distribución combinados?
  • Esto suena como equipo SATA. ¿Cambiaste cables?
  • ¿Qué informa su controlador?
  • Acaso túgoogle la cadena de errorhas estado recibiendo?

información relacionada