En un servidor HP con windows 2008-R2. Hay un controlador raid PCI Silicon Image SATA con 4 discos SATA. En el controlador hay una configuración para convertirlos en una configuración Raid5. Windows los ve como 1 unidad.
Al reiniciar el servidor esta mañana, una de las unidades estaba "saltando" (mecánico). Después del ruido, la pantalla mostraba que faltaba uno de los discos del raid. (esta fue una conclusión equivocada)
Mientras se reinicia el hardware, esta vez con el capó abierto, el disco "faltante" es el único que presenta vibración mecánica. (el motivo de la conclusión errónea). Cuando continúa con el inicio, el sistema muestra 4 dispositivos pero no hay volumen de raid.
Temía que el disco de salto estuviera "sosteniendo" la conexión del volumen raid. SATA es hotswap, así que quité el "disco de error" del controlador raid. Directamente, el software genera un evento "falta dispositivo". Lógico. Lo vuelvo a conectar. Cuando me conecto, veo que desconecté la unidad equivocada. No el disco de error sino uno sano. Repito el proceso para el disco de error. En ese momento escucho el sonido nuevamente y sigo mis oídos. El "salto" proviene del disco de repuesto en la matriz HP. Descubrir la conclusión equivocada
Cuando reinicio el sistema, nuevamente no hay volumen de raid. Voy al "bios" del controlador. Allí las opciones son limitadas. Veo 4 dispositivos que están funcionando y veo la configuración de un raid5 configurado en 4 discos. De vuelta en Windows, inicio el software. Allí veo que 1 disco está activo pero ya no forma parte del raid5. El resto tiene un conjunto de incursiones existente. (ver imagen) El sistema me dice que los 4 discos están en buen estado. El sistema me dice que hay un raid5 configurado en 3 discos. Pero el botón de reconstrucción es gris. Cuando intento: "convertir grupo de raid heredado", aparece un error.
¿Qué puedo intentar hacer para reconstruir el volumen y no perder los datos?
Imprimir pantalla de situación
Actualización 1: la copia de seguridad existente no es lo suficientemente reciente y está incompleta. Se pueden tomar datos de otros lugares, pero la reconstrucción llevará mucho tiempo y será incompleta. Actualizar el servidor a una versión más nueva es una conversación constante y la medida tiene consecuencias para las personas que usan el servidor en diferentes niveles. Saben que lo necesitan, pero se están demorando.
Respuesta1
Verifique el número de serie del disco defectuoso; el controlador le dijo que está defectuoso y valídelo mientras el servidor está apagado antes de reiniciarlo.
Mientras se reinicia el hardware, esta vez con el capó abierto, el disco "faltante" es el único que presenta vibración mecánica. (el motivo de la conclusión errónea). Cuando continúe el inicio,el sistema muestra 4 dispositivos pero no hay volumen de raid.
Lamentablemente, todos los pasos que realizó para recuperarse después del texto en negrita son inútiles, ya que durante el primer reinicio, la matriz raid parece haber sido eliminada del controlador.
Tenga en cuenta que una unidad puede funcionar y hacer ruido en condiciones de uso normal. Este no es el factor principal para detectar la unidad defectuosa. La próxima vez, si el controlador le indica que un disco con s/n X está fallando, utilícelo como una forma de encontrarlo. Si un disco al lado hace un sonido estremecedor, puedes asumir que tu matriz también podría fallar pronto, especialmente en una configuración raid5, donde solo puedes tener un miembro desconectado. Lamentablemente, el sonido estremecedor es una advertencia para asegurarse de tener un respaldo cerca.
Mi consejo es restaurar desde una copia de seguridad sus datos y posiblemente deshacerse de ese controlador defectuoso y, mientras lo hace, actualizar a un sistema operativo compatible.