A matriz FakeRAID está falhando, por quê?

A matriz FakeRAID está falhando, por quê?

Temos um sistema Windows XP com placa-mãe AMD (GA-890GPA-UD3H) e estamos usando o recurso RAID integrado. O sistema está configurado em RAID 1 (utilizando a ferramenta AMD RAIDXpert). Consiste em dois discos rígidos Samsung HD502IJ de 500 GB.

O problema é que o array falha com frequência. A mensagem de erro fornecida é: Logical drive goes critical.Portanto, as unidades não são mais espelhadas.

Posso reconstruir as unidades, mas isso não ajuda muito. O erro se repete de forma irregular/errática. Às vezes falha após 3 dias, às vezes após 7 dias, então não é estável.

Qual é o problema e como posso prová-lo? Posso obter informações SMART nas unidades e elas funcionam individualmente.

Responder1

Tive o mesmo problema com discos rígidos de consumo (WD e Hitachi) montados em vários NAS (com RAID de hardware).

Depois de muitos experimentos, descobri que meu problema estava relacionado às diferentes maneiras pelas quais os discos lidam com atrasos e tempos limite de leitura.

Tive que habilitar o TLER/CCTL no firmware das unidades. Arrays funcionou perfeitamente desde então.

Veja tambémhttp://en.wikipedia.org/wiki/Error_recovery_control

Responder2

Tive muitos problemas com unidades Samsung e um chipset AMD (em um microservidor HP). É um chipset 780G, acredito.

Eu uso Linux e, com alto rendimento nas unidades, recebo mensagens de log reclamando que o controlador não respondeu a tempo e foi reiniciado. Eventualmente acabou corrompendo o array. Desligar o AHCI e mudar para SATA1 ajudou um pouco, mas não resolveu completamente o problema.

Um amigo com o mesmo hardware teve o mesmo problema no Windows Home Server, embora não me lembre do que diziam os logs.

Você consegue ver alguma coisa no eventvwr sobre as unidades?

informação relacionada