
Substituí recentemente um disco com defeito no meu grupo Raid 6. Correu tudo como esperado, sem problemas. Depois de reconstruir tudo usando um novo /dev/sdi1 como substituto do /dev/sde1 com falha, decidi tentar desconectar /dev/sde1. Eu adivinhei errado. Desliguei e conectei o que agora acho que era o cabo SATA do /dev/sdh e liguei novamente.
/dev/sdh1 agora está se recusando a ser adicionado novamente ao array, me dando a mensagem clássica "Dispositivo ou recurso ocupado" quando tento montá-lo ou adicioná-lo a quente.
Procurando, parece estar confundindo /dev/sdh1 com /dev/sdg1:
fs1 etc # mdadm --examine /dev/sdh1
/dev/sdh1:
Magic: a92b4efc
Versão: 0.90.00
UUID: 95b6add0:acea3231:a1c8af6a:322d8026
Tempo de criação: Sábado, 16 de agosto 06:40:57 2008
Nível de ataque: raid6
usado Tamanho do desenvolvedor: 732571904 (698,64 GiB 750,15 GB)
Tamanho da matriz: 3662859520 (3493,18 GiB 3750,77 GB)
Dispositivos Raid: 7
Total de dispositivos: 7
Menores preferidos: 0
Update Time : Sat Dec 7 11:00:34 2013
State : clean
Dispositivos ativos: 7
dispositivos em funcionamento: 7
dispositivos com falha: 0
dispositivos sobressalentes: 0
soma de verificação: 86c78a1c -
eventos corretos: 522025
Layout : left-symmetric
Chunk Size : 64K
Number Major Minor RaidDevice State
esta 3 8 97 3 sincronização ativa /dev/sdg1
0 0 8 9 0 sincronização ativa /dev/sda9
1 1 8 65 1 sincronização ativa /dev/sde1 2 2 8 81 2 sincronização ativa /dev/sdf1
3 3 8 97 3 sincronização ativa /dev/sdg1
4 4 8 33 4 ativa sincronização /dev/sdc1
5 5 8 49 5 sincronização ativa /dev/sdd1
6 6 8 113 6 sincronização ativa /dev/sdh1
Observe que "isto" aparece como tendo o mesmo número secundário que /dev/sdg1. Fazer um "mdadm --examine" em qualquer outro elemento funciona conforme o esperado, com "this" exibindo o número menor que corresponde à partição.
ugh... olhando para todas as coisas "mdadm --examines" parecem ainda mais divertidas. A maioria está mostrando /dev/sda3 (por número menor) como uma unidade com falha, embora /dev/sde1 (menor 65) tenha sido o que falhou e foi removido. /dev/sde1 agora está aparecendo como sobressalente. Até /dev/sdg1, caso contrário, parece OK, mas /dev/sdh1 está relatando como tendo o mesmo número menor que /dev/sdg1, e /dev/sdi1 está relatando como tendo o mesmo número menor que /dev/sdh1.
Como posso corrigir isso? Tentei zerar a frente do disco /dev/sdh e recriar partições, mas isso não ajudou.
Eu tenho um backup dos dados, embora no momento esteja em um único disco. Mesmo assim, até tentei recriar o array, mas ainda assim obtive o "dispositivo ou recurso ocupado":
mdadm --create /dev/md0 --level=6 --raid-devices=7 /dev/sda9 /dev/sdc1 /dev/sdd1 /dev/sdf1 /dev/sdg1 /dev/sdh1 /dev/sdi1
mdadm: /dev/sda9 parece fazer parte de um array raid:
level=raid6 devices=7 ctime=Sáb, 16 de agosto 06:40:57 2008
mdadm: /dev/sdc1 parece fazer parte de um array raid:
level=raid6 devices= 7 ctime = sábado, 16 de agosto 06:40:57 2008
mdadm: /dev/sdd1 parece fazer parte de uma matriz de ataque:
level = raid6 devices = 7 ctime = sábado, 16 de agosto 06:40:57 2008
mdadm: /dev/sdf1 parece fazer parte de uma matriz raid:
level=raid6 devices=7 ctime=Sat 16 de agosto 06:40:57 2008
mdadm: /dev/sdg1 parece fazer parte de uma array raid:
level=raid6 devices=7 ctime=Sat 16 de agosto 06:40:57 2008
mdadm: super1.x não pode abrir /dev/sdh1: dispositivo ou recurso ocupado
mdadm: /dev/sdh1 não é adequado para esta matriz.
mdadm: /dev/sdi1 parece fazer parte de um array raid:
level=raid6 devices=7 ctime=Sábado, 16 de agosto 06:40:57 2008
mdadm: criação abortada