Aqui estão algumas informações básicas:
o computador desktop chegou à minha mesa com 32 GB (4x8) DDR3 1600 MHz não ECC, uma placa gráfica GTX960 e um sistema operacional (Windows 7 Pro) que não inicializava. Depois de um teste de memória noturno e vários testes de memória de vídeo, tudo parecia ótimo! Reparei o sistema operacional offline e inicializei-o. Tela preta e travamento. Achei que a placa de vídeo, que acabara de receber uma atualização de driver, estava com defeito, então a retirei e inicializei novamente. Tudo parecia ótimo e correu como um sonho. Para corrigir os problemas restantes, atualizo para o Windows 10 por solicitação do cliente. Inicializa muito bem após a instalação. E então... Aniquilação total. Ele reiniciou e foi direto para o chkdsk, onde recuperou cerca de 40 GB de arquivos. O WinSxS desapareceu, o sistema operacional estava irreparável e fiquei chocado. Testamos a RAM por mais de 18 horas, executando 5 passagens com memtest e uma passagem usando outra plataforma de teste de memória.
Aqui está a questão:
como todos esses testes ocorreram sem qualquer indicação de problema, antes que essa enorme quantidade de dados fosse quase destruída por memória ruim? Depois de substituir a memória, o sistema funciona bem. O que aconteceu e que tipos de testes realmente detectarão um problema como esse?
Responder1
Como todos esses testes ocorreram sem qualquer indicação de problema,
Testes fáceis e automatizados de alguns dias não conseguem detectar todos os defeitos que possam surgir.
que tipos de testes realmente detectarão um problema como esse?
Não há nenhum que seja 100% preciso. Você faz o que pode e tem planos de contingência em vigor. IE: Como construtor, ofereça garantia e estoque RAM extra. Como usuário, certifique-se de manter alguns backups dos dados que está colocando em uma máquina nova e basicamente não testada.
Experiência pessoal/anedota relacionada:
"Testamos a RAM por mais de 18 horas" - Quando eu trabalhava como/para um construtor de sistemas, costumávamos gravar a RAM (e o sistema em geral) em cada sistema por 72 horas seguidas (mínimo) antes de colocá-los fora do porta. Muitas vezes a RAM morreu no terceiro dia de burn-in, e muitas vezes a RAM ainda falhou em campo depois disso. Essa é a natureza da besta.