btrfs: el disco defectuoso generó errores de suma de comprobación, se reemplazó el disco, los errores persisten

btrfs: el disco defectuoso generó errores de suma de comprobación, se reemplazó el disco, los errores persisten

Tenía un par de discos de 3 TB en una matriz btrfs raid1.

Uno de estos discos comenzó a fallar (smartd muestra sectores defectuosos), por lo que compré un par de unidades nuevas de 8 TB para reemplazar ambos discos de la matriz.

Reemplacé ambos con btrfs replacey ejecuté uno btrfs balancedespués, lo que falla con el siguiente mensaje:

[ 5063.136378] BTRFS error (device sdc): parent transid verify failed on 5153170751488 wanted 1433374 found 1417912
[ 5063.140428] BTRFS error (device sdc): parent transid verify failed on 5153170751488 wanted 1433374 found 1417912

Ahora, he visto estos mensajes precisamenteantesReemplazar los discos, pero ahora que se reemplazaron ambos discos, creo que tiene algo que ver con btrfs.

Mis datos están completamente respaldadosy el sistema de archivos está en línea y funcionando correctamente, pero no puedo realizar un saldo debido a este error. La ejecución de una limpieza produce una pequeña cantidad de errores incorregibles, tal como ocurría antes de reemplazar los discos.

Me preguntaba cómo podría, tal vez:

  1. Descubra qué archivos están dañados y restáurelos desde una copia de seguridad
  2. Restablezca la transacción en el sistema de archivos para eliminar los errores
  3. Ignora los errores al equilibrar

...o cualquier otra solución razonable.

¡Gracias!

Respuesta1

Hice algunos intentos adicionales para resolver esto y, finalmente, solo un reformateo limpio del sistema de archivos resolvió el problema.

Una vez que transfirí los datos de los discos, probé dos comandos peligrosos, btrfs check --init-csum-treey uno btrfs check --repair, ninguno de los cuales causó ningún daño pero no resolvió el problema.

Después de reformatear, volví a transferir los datos al sistema de archivos, ejecuté a btrfs filesystem balancey a btrfs filesystem scruby ahora todo está funcionando nuevamente.

¡Salud!

información relacionada