
Cuidamos de um servidor Fujitsu RX300 S4 que possui 6 unidades SATA de 500 GB em um array RAID-6, rodando a partir de uma placa LSI MegaRAID (integrada na placa-mãe).
Algumas semanas atrás, um disco rígido sinalizou-se como defeituoso (luz laranja no compartimento da unidade, o software MegaRAIDcli mostra um status de firmware "Falha"). Pedimos e substituímos a unidade, mas após o início da reconstrução, uma unidade diferente foi sinalizada como defeituosa.
Isso já aconteceu três vezes - duas vezes ele sinalizou unidades diferentes que apresentavam uma falha e uma vez sinalizou uma unidade que já substituímos.
No momento, duas unidades estão apresentando falhas - não sabemos se as unidades estãona verdadefalhando ou se o backplane ou placa RAID está com defeito.
Alguém já experimentou isso antes? Alguma dica sobre o que fazer a seguir? Recebemos uma ligação da Fujitsu, mas nos perguntamos se alguém teria alguma indicação...
Responder1
Sinto por você. Esse tipo de problema de hardware é extremamente estressante e irritante para depurar.
Em 2002, tive a “alegria” de depurar um problema semelhante. Depois de muito "Vamos substituir um HD" e um servidor semelhante massageando o backplane foi a falha real. Mas aquele era um servidor IBM e uma história completamente diferente.
Se possível, teste as unidades “defeituosas” com outro servidor e veja se elas estão funcionando normalmente lá. Minha coragem me diz que no seu caso não se trata das unidades, algo mais está quebrado. As unidades tendem a não quebrar assim.
Responder2
Este pode ser um controlador com defeito. Pode ser uma energia não confiável. Podem ser cabos SATA ruins. Pode ser apenas um azar extremo.