A unidade de disco reinicia repentinamente e é removida do RAID

A unidade de disco reinicia repentinamente e é removida do RAID

Temos alguns servidores com 6 HDDs em software RAID6. Recentemente, um dos servidores começou a apresentar problemas de desempenho e notei que uma das unidades de disco foi removida do RAID. Eu o adicionei novamente com o mdadm, ele foi sincronizado novamente e tudo voltou ao normal, mas continua acontecendo a cada poucas horas.

O disco é removido do RAID, o mdadm mostra o status do RAID como degradado. A contagem de início/parada do dispositivo aumenta em 1 (em smartctl). Além disso, o dispositivo muda de sdc para sdg e vice-versa. Portanto, não tenho certeza de como depurar o problema ou como evitá-lo. Isso significa que o disco está com defeito e devemos pedir ao nosso hoster para substituí-lo? Ou é um problema de software?

informação relacionada