O controlador RAID diz que a unidade falhou, outro computador diz que está íntegro

O controlador RAID diz que a unidade falhou, outro computador diz que está íntegro

Eu tenho um servidor doméstico com as seguintes especificações:

  • Servidor Lenovo TS140
  • Controlador RAID IBM ServeRAID M5015
  • 4 unidades WD Red de 4 TB (WD40EFRX) em RAID 10
  • Cabo 3WARE SFF-8087 (CBL-SFF8087OCF-05M) conectando as unidades ao controlador RAID

Recentemente, tive uma falha na unidade (após cerca de 8 meses de uso), então fiz RMA, recebi a unidade de substituição e reconstruí o array com sucesso. 24 horas depois, o controlador relatou que a unidade de substituição falhou, então enviei outro RMA. Acabei de receber a nova unidade substituta e, assim que insiro a unidade ou tento reconstruir o array, o alarme do controlador dispara e mostra a nova unidade substituta como com falha.

O estranho é que, se eu tirar a unidade do servidor e colocá-la no meu computador desktop, poderei formatar e usar a unidade sem problemas. Executando um programa que pode ler dados SMART (CrystalDiskInfo), a unidade mostra-se em "Boa" saúde.

Infelizmente não tenho muita experiência com RAID, então não tenho muita certeza de qual é o problema aqui. Devo apenas tentar enviar a unidade de volta para outro RMA? Será que é o cabo SFF-8087 que está falhando? Ou há mais alguma coisa que eu possa fazer para obter mais informações sobre o que pode estar causando esse problema?

Aqui está uma captura de tela mostrando os dados SMART da unidade:

CrystalDiskInfo

Também executei testes automáticos de disco (curtos e estendidos) no PassMark DiskCheckup e no Western Digital Data LifeGuard Diagnostics. Todos os testes passaram:

Resultados do teste de diagnóstico WD

Responder1

Controladores diferentes têm critérios diferentes sobre se uma unidade está saudável o suficiente para isso ou não. Alguns controladores até se recusam a adquirir uma nova unidade, a menos que você reconstrua todo o array.

CorrerDiagnóstico WD Data Lifeguarde veja se a unidade passa nos testes rápidos e estendidos. Você pode até fazer isso com todas as unidades. Isso deve mostrar se as unidades estão íntegras ou não. Você também pode tentar preencher o novo WD Red substituto com zeros (preenchimento completo) com a ferramenta e ver se isso resolveu o problema com o controlador.

Verifique os valores brutos do status SMART, pois eles podem fornecer informações mais precisas sobre a condição do inversor.

Você poderia postar uma captura de tela do teste que você fez?

informação relacionada