
Recientemente reemplacé un disco defectuoso en mi grupo Raid 6. Todo salió como se esperaba, no hay problema. Después de reconstruir todo usando un nuevo /dev/sdi1 como reemplazo del /dev/sde1 defectuoso, decidí intentar desconectar /dev/sde1. Adiviné mal. Apagué y volví a enchufar lo que ahora supongo que era el cable SATA de /dev/sdh y lo encendí de nuevo.
/dev/sdh1 ahora se niega a volver a agregarse a la matriz, lo que me muestra el clásico mensaje "Dispositivo o recurso ocupado" cuando intento ensamblarlo o agregarlo en caliente.
Investigando, parece confundir /dev/sdh1 con /dev/sdg1:
fs1 etc # mdadm --examine /dev/sdh1
/dev/sdh1:
Magic: a92b4efc
Versión: 0.90.00
UUID: 95b6add0:acea3231:a1c8af6a:322d8026
Hora de creación: sábado 16 de agosto 06:40:57
Nivel de incursión de 2008: raid6
usado Tamaño de desarrollo: 732571904 (698,64 GiB 750,15 GB)
Tamaño de matriz: 3662859520 (3493,18 GiB 3750,77 GB)
Dispositivos Raid: 7
Dispositivos totales: 7
Menor preferido: 0
Update Time : Sat Dec 7 11:00:34 2013
State : clean
Dispositivos activos: 7
Dispositivos en funcionamiento: 7
Dispositivos fallidos: 0
Dispositivos de repuesto: 0
Suma de comprobación: 86c78a1c -
Eventos correctos: 522025
Layout : left-symmetric
Chunk Size : 64K
Number Major Minor RaidDevice State
este 3 8 97 3 sincronización activa /dev/sdg1
0 0 8 9 0 sincronización activa /dev/sda9
1 1 8 65 1 sincronización activa /dev/sde1 2 2 8 81 2 sincronización activa /dev/sdf1
3 3 8 97 3 sincronización activa /dev/sdg1
4 4 8 33 4 activa sincronización /dev/sdc1
5 5 8 49 5 sincronización activa /dev/sdd1
6 6 8 113 6 sincronización activa /dev/sdh1
Tenga en cuenta que "esto" muestra que tiene el mismo número menor que /dev/sdg1. Hacer un "mdadm --examine" en cualquier otro elemento funciona como se esperaba, y "this" muestra el número menor que coincide con la partición.
Uf... mirando todas las cosas de "mdadm --examines" se ven aún más originales. La mayoría muestra /dev/sda3 (por número menor) como unidad defectuosa aunque /dev/sde1 (menor 65) fue la que falló y se eliminó. /dev/sde1 ahora se muestra como repuesto. De lo contrario, hasta /dev/sdg1 se ve bien, pero /dev/sdh1 informa que tiene el mismo número menor que /dev/sdg1, y /dev/sdi1 informa que tiene el mismo número menor que /dev/sdh1.
¿Cómo puedo corregir esto? Intenté poner a cero la parte frontal del disco /dev/sdh y recrear particiones, pero eso no ayudó.
Tengo una copia de seguridad de los datos, aunque por el momento está en un solo disco. Aún así, incluso intenté recrear la matriz, pero aún así el "dispositivo o recurso está ocupado":
mdadm --create /dev/md0 --level=6 --raid-devices=7 /dev/sda9 /dev/sdc1 /dev/sdd1 /dev/sdf1 /dev/sdg1 /dev/sdh1 /dev/sdi1
mdadm: /dev/sda9 parece ser parte de una matriz raid:
nivel=raid6 devices=7 ctime=Sábado 16 de agosto 06:40:57 2008
mdadm: /dev/sdc1 parece ser parte de una matriz raid:
nivel=raid6 devices= 7 ctime=sáb 16 de agosto 06:40:57 2008
mdadm: /dev/sdd1 parece ser parte de una matriz raid:
nivel=raid6 devices=7 ctime=sáb 16 de agosto 06:40:57 2008
mdadm: /dev/sdf1 parece ser parte de una matriz raid:
nivel=raid6 devices=7 ctime=Sat 16 de agosto 06:40:57 2008
mdadm: /dev/sdg1 parece ser parte de una matriz raid:
nivel=raid6 devices=7 ctime=Sat 16 de agosto 06:40:57 2008
mdadm: super1.x no se puede abrir /dev/sdh1: dispositivo o recurso ocupado
mdadm: /dev/sdh1 no es adecuado para esta matriz.
mdadm: /dev/sdi1 parece ser parte de una matriz raid:
nivel=raid6 devices=7 ctime=Sat 16 de agosto 06:40:57 2008
mdadm: creación abortada