El controlador RAID dice que la unidad falló, otra computadora dice que está en buen estado

El controlador RAID dice que la unidad falló, otra computadora dice que está en buen estado

Tengo un servidor doméstico con las siguientes especificaciones:

  • Servidor Lenovo TS140
  • Controlador RAID IBM ServeRAID M5015
  • 4 unidades WD Red de 4 TB (WD40EFRX) en RAID 10
  • Cable 3WARE SFF-8087 (CBL-SFF8087OCF-05M) que conecta las unidades al controlador RAID

Recientemente tuve una falla en una unidad (después de aproximadamente 8 meses de uso), así que la RMA, recibí la unidad de reemplazo y reconstruí la matriz exitosamente. 24 horas después, el controlador informó que la unidad de reemplazo falló, por lo que envié otra RMA. Acabo de recibir el nuevo reemplazo y, tan pronto como inserto la unidad o intento reconstruir la matriz, la alarma del controlador suena y muestra que la nueva unidad de reemplazo falló.

Lo extraño es que, si saco el disco del servidor y lo coloco en mi computadora de escritorio, puedo formatear y usar el disco sin ningún problema. Al ejecutar un programa que puede leer datos SMART (CrystalDiskInfo), la unidad se muestra en "buena" salud.

Desafortunadamente, no tengo mucha experiencia con RAID, por lo que no estoy del todo seguro de cuál es el problema aquí. ¿Debería intentar devolver la unidad para otra RMA? ¿Podría ser el cable SFF-8087 el que está fallando? ¿O hay algo más que pueda hacer para obtener un poco más de información sobre lo que podría estar causando este problema?

Aquí hay una captura de pantalla que muestra los datos SMART de la unidad:

CrystalDiskInfo

También ejecuté autopruebas de disco (cortas y extendidas) en PassMark DiskCheckup y Western Digital Data LifeGuard Diagnostics. Todas las pruebas pasaron:

Resultados de la prueba de diagnóstico de WD

Respuesta1

Los diferentes controladores tienen diferentes criterios con respecto a si una unidad está en buen estado o no. Algunos controladores incluso se niegan a recibir una nueva unidad a menos que reconstruya toda la matriz.

CorrerDiagnóstico de salvavidas de datos de WDy vea si la unidad pasa las pruebas rápida y extendida. Incluso puedes hacer esto con todas las unidades. Esto debería mostrarle si las unidades están en buen estado o no. También puede intentar llenar el nuevo WD Red de reemplazo con ceros (relleno completo) con la herramienta y ver si eso solucionó el problema con el controlador.

Verifique los valores brutos del estado SMART, ya que pueden brindarle información más precisa sobre el estado de la unidad.

¿Podrías publicar una captura de pantalla de la prueba que hiciste?

información relacionada