La unidad de disco se reinicia repentinamente y se elimina del RAID

La unidad de disco se reinicia repentinamente y se elimina del RAID

Disponemos de un par de servidores con 6 HDD en software RAID6. Recientemente, uno de los servidores comenzó a experimentar problemas de rendimiento y noté que una de las unidades de disco se eliminó del RAID. Lo volví a agregar con mdadm, se volvió a sincronizar y todo volvió a la normalidad, pero sigue sucediendo cada pocas horas.

El disco se elimina del RAID, mdadm muestra el estado del RAID como degradado. El recuento de inicio/parada del dispositivo aumenta en 1 (en smartctl). Además, el dispositivo cambia de sdc a sdg y viceversa. Así que no estoy muy seguro de cómo solucionar el problema o cómo evitarlo. ¿Eso significa que el disco está defectuoso y debemos pedirle a nuestro proveedor de alojamiento que lo reemplace? ¿O es un problema de software?

información relacionada