mdadm repara un solo fragmento/sector

Question 1

No puedo encontrar una manera de decirle a mdadm que repare este fragmento específico.

Esto se debe a que cuando hay una corrupción silenciosa de los datos, md no tiene suficiente información para saber qué bloque está dañado silenciosamente.

Te invito a leer miresponda a la pregunta 4 ("¿Por qué mdcontinúa usando un dispositivo con datos no válidos?") aquí, que explica esto con más detalle.

Para empeorar las cosas para el diseño propuesto,Si un bloque de paridad sufre una corrupción silenciosa de los datos, ¡la capa Btrfs superior no puede verlo! Cuando falla un disco con el bloque de datos correspondiente y usted intenta reemplazarlo, md utilizará la paridad corrupta y dañará irreversiblemente sus datos. Sólo cuando ese disco falle Btrfs reconocerá la corrupción, pero ya habrá perdido los datos.

Esto se debe a que md no lee bloques de paridad a menos que la matriz esté degradada.

Entonces, ¿hay alguna manera de decirle a mdadm que repare un solo fragmento (que no es la paridad) y posiblemente incluso marcar un sector del disco como defectuoso? ¿Quizás creando un error de lectura io?

Para los sectores defectuosos que el disco duro descubrió por sí mismo, md puede solucionarlo fácilmente porque md identifica el sector defectuoso.

Técnicamente puedes crear un sector defectuoso con hdparm --make-bad-sector, pero ¿cómo sabes qué disco tiene el bloque afectado por la corrupción silenciosa de datos?

Considere este ejemplo simplificado:

Fórmula de paridad:PARITY = DATA_1 + DATA_2

+--------+--------+--------+
| DATA_1 | DATA_2 | PARITY |
+--------+--------+--------+
|      1 |      1 |      2 | # OK
+--------+--------+--------+

Ahora corrompamos cada uno de los bloques silenciosamente con un valor de 3:

+--------+--------+--------+
| DATA_1 | DATA_2 | PARITY |
+--------+--------+--------+
|      3 |      1 |      2 | # Integrity failed – Expected: PARITY = 4
|      1 |      3 |      2 | # Integrity failed – Expected: PARITY = 4
|      1 |      1 |      3 | # Integrity failed – Expected: PARITY = 2
+--------+--------+--------+

Si no tuviera la primera tabla para mirar, ¿cómo sabría qué bloque está dañado?
No puedes estar seguro.

Esta es la razón por la que Btrfs y ZFS bloquean la suma de comprobación. Se necesita un poco más de espacio en disco, pero esta información adicional permite al sistema de almacenamiento determinar qué bloque se encuentra.

DeArtículo del blog de Jeff Bonwick "RAID-Z":

Cada vez que lee un bloque RAID-Z, ZFS lo compara con su suma de comprobación. Si los discos de datos no arrojaron la respuesta correcta, ZFS lee la paridad y luego realiza una reconstrucción combinatoria para determinar qué disco devolvió datos incorrectos.

Para hacer esto con Btrfs en md, tendría que intentar recalcular cada bloque hasta que la suma de verificación coincida en Btrfs, un proceso que requiere mucho tiempo y que no presenta una interfaz sencilla para el usuario/script.

Sé que ZFS puede hacer todo esto por sí solo, pero no quiero usar memoria ECC

Ni ZFS ni Btrfs sobre md dependen o siquiera conocen la memoria ECC. La memoria ECC solo detecta daños silenciosos en los datos de la memoria, por lo que es independiente del sistema de almacenamiento.

He recomendado ZFS sobre Btrfs para RAID-5 y RAID-6 (análogo a ZFS RAID-Z y RAID-Z2, respectivamente) antes en¿Btrfs sobre mdadm raid6?yDispositivo fallido en md RAID cuando ATA deja de responder, pero me gustaría aprovechar esta oportunidad para resumir algunas ventajas más de ZFS:

Cuando ZFS detecta una corrupción silenciosa de los datos, se corrige automática e inmediatamente en el acto sin ninguna intervención humana.
Si necesita reconstruir un disco completo, ZFS solo "regenerará" los datos reales en lugar de ejecutarlos innecesariamente en todo el dispositivo de bloque.
ZFS es una solución todo en uno para volúmenes lógicos y sistemas de archivos, lo que la hace menos compleja de administrar que Btrfs además de md.
RAID-Z y RAID-Z2 son confiables y estables, a diferencia
- Btrfs en md RAID-5/RAID-6, que solo ofrece detección de errores en bloques de datos corruptos silenciosamente (además, los bloques de paridad corruptos silenciosamente pueden pasar desapercibidos hasta que sea demasiado tarde) y no hay una manera fácil de corregir errores, y
- Btrfs RAID-5/RAID-6, que "tiene varios errores graves de pérdida de datos".
Si corrompiera silenciosamente un disco completo con ZFS RAID-Z2, no perdería ningún dato, mientras que en md RAID-6,De hecho, perdí 455.681 inodos..

Answer