Reconstruindo matriz Raid

Reconstruindo matriz Raid

Olá, quero reconstruir meu array raid e encontrei uma página na documentação do redhat que diz como fazer isso, mas não parece fazer sentido.

Aqui está um link para a documentaçãoA parte sobre a qual estou confuso é a etapa 5:

" Para restaurar o disco, execute uma "falha de software" na fatia sobressalente anterior: mdadm --manage --set-faulty /dev/md0 /dev/sdc3 ". O sistema tentará agora reconstruir a matriz no disco substituído.

Isso não apenas não faz sentido no idioma inglês, mas também não vejo como o mdadm reconstruirá automaticamente o array imediatamente após eu ter configurado um dos discos para falhar. Isso é apenas um erro na documentação? Por favor me ajude, estou confuso. Alguém pode me dizer se essas instruções estão corretas antes que eu estrague alguma coisa? Obrigado.

Responder1

Concordo com você que a documentação está (pelo menos) errada.

AVISO LEGAL: Não possuo um sistema RHEL. Tenho uma vasta experiência em ataques Debian, em diferentes versões do Debian, mas definitivamente nunca coloquei minhas mãos em um sistema RHEL. Teste isso em um sistema sobressalente (VM) antes de agir em uma máquina de produção.

Isto é o que vai acontecer:

  1. Remova o disco da matriz raid.

    mdadm --manage /dev/md0 -r /dev/sdc3

A partição sdc3 será expulsa do array md0.

  1. Remova o disco do sistema.

Todo o disco sdc, incluindo sua partição sdc3, não estará mais no sistema, presumo que "eles" querem que simplesmente "coloquemos o disco sdc com falha na mesa" por enquanto.

  1. Usandofdisk, substitua o disco removido e reformate o disco substituto.

Você conecta umnovodisco sdc, então você particiona-o novamente exatamente como o que falhou. Neste ponto, uma partição "sdc3 existirá novamente no sistema

  1. Adicione o novo disco de volta à matriz RAID.

    mdadm --manage /dev/md0 -a /dev/sdc3

A partição sdc3 será adicionada ao array,e uma ressincronização será iniciada automaticamente e imediatamente. Isso é simplesmente o que é necessário para substituir um disco com falha. Você simplesmente tem que esperar a ressincronização terminar, observando /proc/mdstat e nada mais. Mas a documentação continua.

  1. Para restaurar o disco, execute uma "falha de software" na fatia sobressalente anterior:

    mdadm --manage --set-faulty /dev/md0 /dev/sdc3

Isto definirá a partição sdc3 como defeituosa, simulando uma falha de hardware. Você vai voltar paraantesetapa 1, quando a partição sdc3 falhou.

  1. O sistema tentará agora reconstruir a matriz no disco substituído. Use o seguinte comando para monitorar o status:

    assista -n 1 gato /proc/mdstat

Na verdade não. O sistema aguardará sua intervenção e agora você deverá seguir as etapas 1 a 4 novamente. Porém, este comando é o correto para monitorar o progresso da ressincronização, com atualizações de 1 segundo. Pressione CTRL+C para sair doassistirprocesso.

  1. Quando a reconstrução da matriz for concluída, remova e adicione novamente o disco com falha de software à matriz.

    mdadm --manage /dev/md0 -r /dev/sdc3

    mdadm --manage /dev/md0 -a /dev/sdc3

Na verdade, esses dois comandos farão com que o processo de reconstrução (ressincronização) seja iniciado. São exatamente os passos 1 e 4 (os passos 2 e 3 não são necessários agora, pois o disco não falhou por causa de um problema real, mas por causa de um erro simulado). Agora você precisa aguardar a conclusão do processo de reconstrução, monitorando /proc/mdstat.

  1. Verifique a matriz.

    mdadm --detail /dev/md0

Isso lhe dará mais informações sobre o array md0, mas nada mais sobre o processo de ressincronização que você já pode obter em/proc/mdstat. Não é necessário.

informação relacionada