Controlador P420i/2 discos fallaron en RAID5/RAW FS después de la inicialización de paridad

Controlador P420i/2 discos fallaron en RAID5/RAW FS después de la inicialización de paridad

Nos despertamos esta mañana con 2 discos fallidos en RAID5 con una única configuración de repuesto en caliente.

El disco de repuesto en caliente no reemplazó ningún disco dañado, tal vez porque hay 2 discos que fallaron al mismo tiempo.

Sin embargo, agregué dos discos nuevos y la paridad se está inicializando ahora, pero el sistema de archivos de la partición cambió a RAW. ¿Debo esperar para finalizar la inicialización? o perdí todos los datos del volumen lógico... ¿Recomienda utilizar un software de recuperación comercial para restaurar (archivos VHDX) desde RAW FS? por favor avise.

Respuesta1

¿Recomienda utilizar software de recuperación comercial para restaurar (archivos VHDX) desde RAW FS? por favor avise

R5 no se recupera de la falla de dos discos; de todos modos, también es peligrosamente malo en estos días, no lo vuelva a usar. De todos modos, puedes intentar recuperarlos, pero será costoso, llevará un tiempo y es poco probable que ayude; lo mejor es recuperarlos desde la copia de seguridad, mucho más rápido, y en R1/10 R6/60, por favor :)

Respuesta2

No es raro que falle una unidad en un RAID5 y luego que falle una segunda unidad durante la reconstrucción, si no se ha cuidado la matriz.

El núcleo del problema es que algunos bloques de datos no utilizados pueden degradarse lentamente (pudrición de bits). Simplemente no se detecta (y la unidad lo repara/reasigna automáticamente) porque no se ha vuelto a leer. Sin embargo, en una reconstruccióntodolos datos deben leerse y, si no se pueden reconstruir, falla. Gorrón.

Usar clases RAID con redundancia múltiple como los niveles 6 o 60 es una buena manera de evitar este tipo de problemas; en resumen: RAID 6 es prácticamente inmune a la degradación de bits y amuchomejor opción que RAID 5 + repuesto dinámico.

Los niveles RAID 1 y 10 también pueden presentar el problema de descomposición de bits, pero la probabilidad es menor que con R5.

A veces, no puede ejecutar nada más que los niveles RAID 5 o 50. En ese caso, es esencial (y también una buena idea para los otros niveles RAID) queejecute un escaneo de medios regular, también conocido como limpieza de disco, patrulla de medios, lectura de patrulla, escaneo de superficie. Eso asegura quetodoLos errores leves se corrigen antes de que se conviertan en errores graves. Curiosamente, la limpieza no está activa de forma predeterminada en la mayoría de los controladores.

En su caso, los datos se han dañado o se han puesto a cero de todos modos. Simplemente vuelva a crear la partición, formatee y restaure desde la copia de seguridad. Por supuesto, unla copia de seguridad periódica es aún más esencialque la limpieza del disco. Incluso un RAID bien cuidado no reemplaza una buena estrategia de respaldo.

información relacionada