
He configurado un servidor FreeNAS (11.2-U8) en casa que contiene 8 unidades compuestas por unidades Seagate Barracuda ST2000DM006 de 2 TB en una configuración RAID-Z2.
El resto del hardware del sistema es el siguiente:
- UPC: CPU Intel(R) Core(TM) i3-4170 a 3,70 GHz
- Fuente de alimentación: EVGA 100-W1-0500-KR
- tarjeta madre: ASRock C226 (compatible con ECC)
- RAM: NEMIX RAM 16 GB (2 x 8 GB) DDR3-1066 MHz PC3-8500 (ECC)
Esta configuración ha estado funcionando durante 2,5 años sin problemas, después de lo cual comencé a tener errores de SATA en un disco duro conectado al puerto ADA7. En mi opinión, 2,5 años son poco, decidí reemplazar la unidad por una unidad de "grado NAS" que tiene una garantía más larga, así que compré un WD Red Pro WD2002FFSX.
Después de restaurar exitosamente el grupo, comencé a recibir el mismo tipo de errores SATA con esta nueva unidad después de solo unos días de operaciones.
Comencé a sospechar de los cables, así que cambié un extremo del cable SATA de la unidad en ADA6 y ADA7, conectando la unidad problemática en ADA6. Los errores siguieron señalándose, pero ahora en ADA6; eliminando la posibilidad de un cable defectuoso o incluso un problema con el puerto de la placa base.
Después de volver a enchufar todo en sus respectivos puertos, procedí a cambiar los cables de alimentación de ADA6 y ADA7. Los errores todavía estaban presentes en ADA7, lo que significa que el cable de alimentación está limpio.
Dicho esto, ¿cuál es mi siguiente paso de depuración? No soy un experto en el tema y parece que tengo muy mala suerte y tengo dos discos defectuosos o está sucediendo algo más y no tengo idea de qué es.
El error que recibo es el siguiente:
Device: /dev/ada7, ATA error count increased from 2960 to 2961
Device: /dev/ada7, not capable of SMART self-check
Pool main state is DEGRADED: One or more devices has experienced an unrecoverable error. An attempt was made to correct the error. Applications are unaffected.
Debo mencionar que todos los discos duros son compatibles con SMART. A veces, el NAS funciona sin problemas durante unos días y luego comienza a enviarme correos electrónicos repetidamente informándome de problemas. Realmente es un comportamiento esporádico.
Respuesta1
Creo que esto fue un problema de software. No puedo precisar exactamente, pero ejecutar todas las actualizaciones posibles en mi NAS (cambiar al último tren de actualización 11.3 y ejecutar todas las actualizaciones del grupo) parece haber funcionado.
Llevo casi 2 meses funcionando sin problemas desde que actualicé todo.