Estado de PERC S100 incorrecto

Estado de PERC S100 incorrecto

PE T310 con PERC S100, una matriz RAID 5 con tres unidades, el estado del disco virtual falla, pero arranca y todo parece funcionar.

Todas las unidades de Server Administrator están en línea con una marca verde, pero una no tiene tareas disponibles.

También he visto un desacuerdo entre OMSA y el BIOS. Si inicio en la BIOS, una unidad está en estado lista, otra en estado en línea y otra en estado libre.

Actualicé los controladores BMC, BIOS y PERC S100 a la última versión y esto continúa.

¿Es este un problema común? ¿Hay algo que pueda hacer para remediar esto? Si un disco realmente falla, no lo sabría, ya que estoy volando a ciegas.

Respuesta1

Parece que lo más probable es que se trate de una simple falla de la unidad, combinada con algunos problemas de OMSA/controlador al mostrar el estado adecuado.

La unidad problemática es probablemente la que está viendo en un estado "listo" desde el BIOS; eso solo significa que la unidad aún funciona cuando el controlador intenta inicializarla, pero ya no es un miembro activo del conjunto RAID debido a cualquier problema que tuviera inicialmente.

Sin embargo...

...una unidad está en estado lista, otra en estado en línea y otra en estado libre

¿Cuántos discos duros en total hay en este controlador? Si solo están las 3 que está enumerando y el menú BIOS del controlador solo informa que 1 de 3 unidades es un miembro saludable del RAID5 (lo cual es claramente incorrecto, ya que tiene acceso a los datos), entonces no podemos confiar en la información. que el controlador y OMSA nos brindan con respecto a la salud/estado del disco duro.

Actualicé los controladores BMC, BIOS y PERC S100.

¿Actualizó también el firmware del PERC S100? Yo diría que eso es igualmente importante y probablemente sea el culpable de la mala información observada.

el estado del disco virtual es fallido

¿Esto es de OMSA o del BIOS del controlador? Sería bueno conocer el estado de VD de ambas partes.

Actualice el firmware del controlador si aún no lo ha hecho. De lo contrario, es posible que no haya mucho más que puedas hacer aparte de eliminar y volver a crear el RAID. Sería recomendable ponerse en contacto con el soporte de Dell en ese momento.

Respuesta2

Vale la pena señalar que reemplacé una unidad en esta matriz hace unas semanas (la matriz figuraba como degradada y no falló), verifiqué que inició la reconstrucción y nunca más la revisé. Ahora veo en los registros que la reconstrucción falló debido a errores de datos en los discos originales. Espero que si pudiera completar la reconstrucción estaría en buena forma.

El S100 no parece tener firmware: ¿es un controlador únicamente de software? Al menos no puedo encontrar ninguna descarga de firmware. Sin embargo, estoy usando la última versión del controlador.

En otros controladores PERC de gama alta, pude iniciar una verificación de coherencia de la matriz. Me encantaría poder hacer eso aquí y luego reconstruirlo, pero no veo esa opción en OMSA en este controlador.

¿Es mi única opción si no puedo completar la reconstrucción para recrear el conjunto RAID y restaurar desde la copia de seguridad para recuperar la coherencia en OMSA y el BIOS del controlador, sin mencionar los discos mismos?

información relacionada