Entonces, mi Sunfire x2200 M2 tiene dos unidades SATA, una de 250 GB y otra de 2 TB. En algún momento de anoche/esta mañana, el sistema se reinició solo. Volvió a funcionar bien, pero después de revisar algunos registros, encontré esto:http://pastebin.com/Bctbzwb9.
da0
es la unidad de 250 GB, que es la unidad del sistema operativo. Revisé la información de las unidades con smartctl
y todo parecía estar bien, sin embargo, al ejecutar una prueba con smartctl
, falló con un error de lectura. Luego noté esto en var/log/messages
:
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], 7 Currently unreadable (pending) sectors
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], 7 Offline uncorrectable sectors
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], previous self-test completed with error (read test element)
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], Self-Test Log error count increased from 0 to 1
No estoy realmente seguro de qué hacer con esto. ¿Parece esto una unidad o un controlador defectuoso?
smartctl -a /dev/da0
producción:http://pastebin.com/RJ6043KJ
Respuesta1
Esto parece un disco defectuoso.
Cualquier unidad SATA moderna (y cualquier unidad SCSI antigua) tiene sumas de comprobación en un sector. Si lo lees y la suma de verificación no coincide, volverá a leer los datos. Si la relectura de los datos falla con suficiente frecuencia, la unidad asumirá que el sector físico del disco está defectuoso.
Pueden pasar dos cosas si eso ocurre:
- La unidad hará un esfuerzo por recuperar los datos y, una vez que se lean correctamente, los escribirá en un sector libre. La próxima vez que intentes leer en el sector original, serás redirigido al sector de repuesto. Si esto está en progreso pero no se ha completado exitosamente, entonces el estado espendiente(tal como en su registro).
- Si esto sucede con suficiente frecuencia, la unidad se quedará sin sectores libres. Ya no puede utilizar un repuesto y la lectura generará un error de lectura.
En su registro tiene entradas para currently unreadable (pending) sectors
y 7 Offline uncorrectable sectors
. Esto parece un claro indicador del caso 1).