Errores en un sistema de archivos zpool

Errores en un sistema de archivos zpool

Estoy usando ZFS en una máquina Debian 9. Esta máquina lleva años funcionando sin ningún problema hasta el día de hoy.

El grupo zfs está montado encima de un sistema RAID, controlado por hardware (por lo que solo una unidad está expuesta a Linux como sda). Puede ver el resultado de "estado de zpool" a continuación.

Antes de continuar solo mencionar que verifiqué la consistencia del RAID y todo está bien.

De repente, todos los accesos al sistema de archivos provocan que el comando se congele (incluso un comando ls) y, finalmente, necesito reiniciar la máquina manualmente.

Cuando se ejecuta zpool status -v, la salida es:

#/sbin/zpool status -v
  pool: export
 state: ONLINE
status: One or more devices has experienced an error resulting in data
        corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
        entire pool from backup.
   see: http://zfsonlinux.org/msg/ZFS-8000-8A
  scan: scrub repaired 0B in 53h4m with 0 errors on Tue Mar 15 05:28:38 2022
config:

        NAME        STATE     READ WRITE CKSUM
        export      ONLINE       0     0     0
          sda       ONLINE       0     0     0

errors: Permanent errors have been detected in the following files:

        export/home:<0x0>
        export/home:<0x2b2ed23>
        export/home:<0x2e1183b>
        export/home:<0x2b2e849>
        export/home:<0x1d0b5b1>

Entonces, la pregunta principal es: ¿Cuál es el significado de esos archivos? ¿Cómo soluciono este problema?

¡Gracias de antemano!

Respuesta1

Ejecute uno zpool cleary dos exfoliantes si puede y luego vea el resultado.

Respuesta2

Aquelloseraarchivos corruptos y ahora siguen siendo metadatos:

export/home:<0x0>
export/home:<0x2b2ed23>
export/home:<0x2e1183b>
export/home:<0x2b2e849>
export/home:<0x1d0b5b1>

La causa probablemente sea una falla de hardware, pero necesita más información para señalar la causa raíz y probablemente su tarjeta RAID lo detendrá.

Usando un dispositivo de hardware RAID bajo ZFSno es recomendadopara evitar la situación exacta que encuentra: tiempos difíciles para diagnosticar problemas.

Mis dos centavos:

  • deja que ZFS administre tus discos (está hecho para ello)
  • use la versión más reciente de ZFS (y un sistema operativo adecuado)

información relacionada