Reconstrucción del conjunto de incursiones

Reconstrucción del conjunto de incursiones

Hola, quiero reconstruir mi matriz raid y encontré una página en la documentación de Redhat que dice cómo hacerlo, pero no parece tener sentido.

Aquí hay un enlace a la documentación.La parte que me confunde es el paso 5:

" Para restaurar el disco, realice una "falla de software" en el segmento de repuesto anterior: mdadm --manage --set-faulty /dev/md0 /dev/sdc3 ". El sistema ahora intentará reconstruir la matriz en el disco reemplazado.

Esto no sólo no tiene ningún sentido en el idioma inglés, sino que no veo cómo mdadm reconstruirá automáticamente la matriz inmediatamente después de haber configurado uno de los discos para que falle. ¿Es esto sólo un error en la documentación? Por favor ayuda estoy confundido. ¿Alguien puede decirme si estas instrucciones son correctas antes de que arruine algo? Gracias.

Respuesta1

Estoy contigo en que la documentación es (al menos) incorrecta.

DESCARGO DE RESPONSABILIDAD: No poseo un sistema RHEL. Tengo una amplia experiencia en raids de Debian, desde diferentes versiones de Debian, pero definitivamente nunca puse mis manos en un sistema RHEL. Pruebe esto en un sistema de repuesto (VM) antes de actuar en una máquina de producción.

Esto es lo que pasará:

  1. Retire el disco de la matriz raid.

    mdadm --manage /dev/md0 -r /dev/sdc3

La partición sdc3 será expulsada de la matriz md0.

  1. Retire el disco del sistema.

El disco sdc completo, junto con su partición sdc3, ya no estará en el sistema, supongo que "ellos" quieren que simplemente "coloquemos el disco sdc fallido en el escritorio" por ahora.

  1. Usandodisco duro, reemplace el disco extraído y vuelva a formatear el disco de reemplazo.

Conectas unnuevodisco sdc, luego lo vuelve a particionar exactamente como el que falló. En este punto, volverá a existir una "partición sdc3 en el sistema".

  1. Vuelva a agregar el nuevo disco a la matriz RAID.

    mdadm --manage /dev/md0 -a /dev/sdc3

La partición sdc3 se agregará a la matriz,y una resincronización comenzará automáticamente, e inmediatamente. Esto es simplemente lo que se necesita para reemplazar un disco defectuoso. Simplemente tienes que esperar a que finalice la resincronización, mirando /proc/mdstat, y nada más. Pero la documentación continúa.

  1. Para restaurar el disco, realice una "falla de software" en el segmento de repuesto anterior:

    mdadm --manage --set-faulty /dev/md0 /dev/sdc3

Esto establecerá la partición sdc3 como defectuosa, simulando una falla de hardware. volverás aantesPaso 1, cuando falló la partición sdc3.

  1. El sistema ahora intentará reconstruir la matriz en el disco reemplazado. Utilice el siguiente comando para monitorear el estado:

    reloj -n 1 gato /proc/mdstat

En realidad no. El sistema esperará tu intervención y ahora deberás seguir los pasos 1-4 nuevamente. Sin embargo, este comando es el adecuado para monitorear el progreso de la resincronización, con actualizaciones de 1 segundo. Presione CTRL+C para salir delmirarproceso.

  1. Cuando la matriz haya terminado de reconstruirse, retire y luego vuelva a agregar el disco con fallas de software a la matriz.

    mdadm --manage /dev/md0 -r /dev/sdc3

    mdadm --manage /dev/md0 -a /dev/sdc3

En realidad, estos dos comandos harán que comience el proceso de reconstrucción (resincronización). Son exactamente los pasos 1 y 4 (los pasos 2 y 3 no son necesarios ahora, ya que el disco no ha fallado por un problema real, sino por un error simulado). Ahora debe esperar a que finalice el proceso de reconstrucción, monitoreando /proc/mdstat.

  1. Verifique la matriz.

    mdadm --detalle /dev/md0

Esto le dará más información sobre la matriz md0, pero nada más sobre el proceso de resincronización que ya puede obtener en /proc/mdstat. No es necesario en absoluto.

información relacionada