
Aquí hay una breve historia de cómo llegué aquí:
- 4x disco Ubuntu 12.04 software RAID10 con 5x particiones (md0 - md4)
- 1x disco murió
mdadm --fail
>mdadm --remove
> unidad extraída físicamente y reemplazadamdadm --add
> disco resincronizado perfectamente para todas las particiones- decidió reemplazar todos los discos para que fueran idénticos
- repita los pasos 3-4 para los 3 discos restantes. El segundo y tercer disco salieron perfectos.
- Después de reemplazar el disco final, lo agregué nuevamente a la matriz, pero se me notificó que el sistema de archivos estaba en modo de solo lectura.
cat /proc/mdstat
reveló que algunas particiones habían desaparecido pero era muy inconsistente.- Reinicié la máquina (probablemente no sea la idea más inteligente)
- La máquina no arranca (supongo que no hay MBR en el nuevo disco).
- Reemplacé el último disco que saqué. La máquina arranca según
intitramfs
el mensaje pero el teclado no responde. - Retire la última unidad para que ahora solo queden los 3 discos buenos.
- Arranque desde Ubuntu Live USB.
- La utilidad de disco de Ubuntu enumera los dispositivos RAID 4x y dice que están inactivos y parcialmente ensamblados.
ubuntu@ubuntu:~$ cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md3 : inactive sdd8[6](S) sdc8[5](S) sdb8[4](S) 1464837120 blocks super 1.2 md4 : inactive sdd9[6](S) sdc9[5](S) sdb9[4](S) 718365696 blocks super 1.2 md1 : inactive sdd6[6](S) sdc6[5](S) sdb6[4](S) 146479104 blocks super 1.2 md2 : inactive sdd7[6](S) sdc7[5](S) sdb7[4](S) 585931776 blocks super 1.2 md0 : inactive sdd5[6](S) sdc5[5](S) sdb5[4](S) 14641152 blocks super 1.2 unused devices: <none>
ubuntu@ubuntu:~$ sudo mdadm --assemble --verbose /dev/md0 -f /dev/sdb5 /dev/sdc5 /dev/sdd5
mdadm: buscando dispositivos para /dev/md0 mdadm: no se puede abrir el dispositivo /dev/sdb5: dispositivo o recurso ocupado mdadm: /dev/sdb5 no tiene superbloque - ensamblaje abortado
¡Así que ahora estoy un poco estancado! Los discos 3x allí eran todos consistentes en el momento en que se reemplazó el cuarto disco. Las comprobaciones SMART salen bien (sin sectores defectuosos, etc.).
Solo necesito una forma de restaurar la matriz con discos 3x para poder volver a agregar el cuarto. ¿Alguna idea?
¡Muchas gracias!
Respuesta1
Inspeccione la salida de mdadm --examine en cada partición de unidad miembro de RAID. Le mostrará información del estado y, con suerte, le mostrará dónde puede estar el problema.
También verifique el estado SMART de sus unidades para ver si están en buen estado.
Respuesta2
Resolví esto de la siguiente manera desde un Ubuntu Live USB (tuve que instalar mdadm):
mdadm --stop /dev/md[01234]
mdadm --assemble /dev/md0 --verbose /dev/sd[abc]5
(tenga en cuenta que usé solo las 3 unidades buenas).- repetir para cada
/dev/mdx
- Si recibo un error de "dispositivo o recurso ocupado", lo volvería a hacer
--stop
y/dev/mdx
repetiría el archivo--assemble
. No tengo idea de por qué esto funcionó, pero así fue. mdadm --manage /dev/mdx --add /dev/sddx
para cada/dev/mdx
y respectiva/dev/sddx
partición- Todos los discos estaban sincronizados en sus matrices, mdadm feliz.
- Seguí las instrucciones aquí.https://help.ubuntu.com/community/Grub2/Installing(montar el sistema de archivos del sistema operativo > chroot > instalar grub en cada unidad > actualizar grub > reiniciar)
- ???
- Ganancia. La máquina arrancó, detectó errores en el sistema de archivos en la partición del sistema operativo, pero los reparó (los discos probablemente se cayeron en momentos ligeramente diferentes). Después de reparar y reiniciar, todo vuelve a funcionar sin pérdida de datos.