2 unidades "fallaron" en un RAID 5 de 3 unidades

2 unidades "fallaron" en un RAID 5 de 3 unidades

Pero no lo creo.

La máquina es un servidor Dell PowerEdge 2600 que ejecuta Windows Server 2008 de prueba de 32 bits (sí, se supone que no... ¡pero funciona! [bueno, solía hacerlo]).

Para evitar confusión: las unidades están numeradas 0, 1 y 2.

Estaba codificando como de costumbre cuando noté que el logotipo de Dell en el frente de la carcasa era naranja. Entonces abrí la puerta de la caja y vi que las rejillas de ventilación del HD estaban completamente cubiertas de polvo (sé que no está relacionado con la luz naranja... pero odio el polvo). Como las unidades se pueden intercambiar en caliente, saqué la unidad 2, le quité el polvo y la volví a colocar. Luego saqué la unidad 1, le limpié el polvo y la volví a colocar. Alguien me pidió que me ayudara a configurar una impresora en su máquina, así que me levanté y 20 minutos después volví y vi "No hay dispositivo de arranque disponible: presione F1 para reintentar el arranque, F2 para la utilidad de configuración" en el monitor del servidor. Miro las unidades y las unidades 1 y 2 tienen luces naranjas en lugar de verdes.

Desde entonces esto es lo que he probado:

  • Unidades instaladas en un Dell PowerEdge 2500. Las unidades se detectaron bien. Recibí un mensaje que indicaMissing operating system.
  • Restablezca la BIOS en el PowerEdge 2600 original (sacó la batería de la BIOS). Todas las unidades parecen estar bien. Recibe el Missing operating systemmensaje al iniciar. Las luces de una unidad están en verde.
  • Arranqué Ubuntu desde un CD para inspeccionar las unidades. 2 de las unidades se muestran en Computer.Dado que los datos están divididos, los archivos/carpetas en las unidades son un galimatías.
  • Arranqué Ubuntu y lo abrí Terminaly ejecuté sudo fdisk -l, que enumeraba las 3 unidades. En la tercera unidad de la lista, diceDisk identifier: 0x00000000 Disk /dev/sdb doesn't contain a valid partition table

¿Crees que las unidades ESTÁN realmente tostadas?
¿Podría ser SCSI u otra falla de hardware?
¿Podría ser una configuración del sistema incorrecta? ¿Hay alguna forma de crear un RAID virtual en Ubuntu en las 2 unidades que son "válidas" para poder copiar los datos a un recurso compartido de red?
¿Debo intentar reinstalar el sistema operativo Windows Server (¡eek!)? ¿Tiene alguna sugerencia que pueda probar?


ACTUALIZAR

Después de buscar mucho en Google encontréReconstructor de incursiones. Probé este programa usando mi Dell PowerEdge 2600 usando un CD de arranque de Windows XP pero no funcionó (no se detectaron unidades). Luego instalé dos de las unidades en el PowerEdge 2500 junto con el RAID 0 de una sola unidad existente del 2500 con Microsoft Server 2003. Luego instalé y activé Raid Reconstructor, que creó una imagen virtual de la matriz RAID-5, abrí la imagen conCapitán Nemo, y hice una copia de seguridad de mi directorio C:/Websites en otra computadora... conTODOS los archivos intactos(hasta ahora)!!!

Espero poder restaurar las unidades al 100%.

Lecciones aprendidas:

  • No me importa si el servidorpoderunidades "intercambiables en caliente". ¡NO LO HAGAS!
  • ¡Haz una copia de seguridad de tus datos, tonto!

¡Gracias por toda su ayuda, respuestas y comentarios (y por equivocarse con la pérdida de datos, jaja)!

Respuesta1

El mayor '¡Doh!' de la semana, creo, lo siento amigo.

Las unidades en sí no se romperán físicamente, esto es simplemente porque usted eliminó la matriz quitando un segundo disco antes de que se reconstruyera el primero. Estoy >90% seguro de que su matriz está tostada. Básicamente, no deberías haberlos eliminado en absoluto mientras estaban en vivo; si fuera absolutamente necesario, deberías haber esperado a que la matriz se reconstruya antes de hacer el segundo disco.

Me temo que es hora de reinstalar/restaurar: sus datos desaparecieron.

Respuesta2

Después de recuperar mis datos con Raid Reconstructor, fui a reconfigurar mi raid y reinstalar el sistema operativo.

Cuando recibí el mensaje de instalación del sistema operativo, decidí por última vez intentar reparar los archivos de arranque del sistema operativo manualmente desde el mensaje CMD...

Funcionó.

La computadora vuelve a funcionar (cojea). Todavía necesito realizar una instalación de reparación completa ya que algunos archivos del sistema se informan como corruptos.

Respuesta3

Muchas veces es el backplane o el controlador scsi lo que está mal. Si fue un problema del backplane, en mi caso 9 de cada 10 veces fue un problema de firmware.

en el 2500, ¿hizo que reconstruyera la matriz o simplemente colocó las unidades y encontró la matriz?

editar:
¡Debería haber leído mejor tu pregunta! Chopper3 tiene razón.

información relacionada