RAM をテストするというのはどういうことですか?

RAM をテストするというのはどういうことですか?

ちょっとした背景を説明します。
デスクトップ コンピューターが私のデスクに届きましたが、32GB (4x8) DDR3 1600MHz non-ECC、GTX960 グラフィック カード、起動しない OS (Windows 7 Pro) が搭載されていました。一晩中メモリ テストを行い、ビデオ メモリ テストを数回行ったところ、すべて正常に見えました。OS をオフラインで修復して起動しました。画面が真っ黒になり、クラッシュしました。ドライバーをアップグレードしたばかりのビデオ カードに問題があると考え、取り外して再度起動しました。すべて正常に見え、夢のように動作しました。残りの問題を解決するために、クライアントの要求に応じて Windows 10 にアップグレードしました。インストール後、問題なく起動します。そして... 完全な破滅。再起動してすぐに chkdsk に進み、約 40GB のファイルを回復しました。WinSxS はなくなり、OS は修復不能で、ショックを受けました。RAM を 18 時間以上テストし、memtest で 5 回、別のメモリ テスト プラットフォームを使用して 1 回実行しました。

ここで疑問が湧きます。
大量のデータが不良メモリによってほぼ破壊される前に、問題の兆候もなく、どのようにしてこのすべてのテストが行​​われたのでしょうか。メモリを交換した後、システムは正常に動作します。何が起こったのでしょうか。また、どのようなテストでこのような問題を実際に検出できるのでしょうか。

答え1

問題の兆候がないまま、なぜこのようなテストが行​​われたのか?

数日間にわたる簡単な自動テストでは、発生する可能性のあるすべての欠陥を検出することはできません。

実際にこのような問題を検出するにはどのようなテストが必要ですか?

100% 正確なものはありません。できることをし、緊急時対応策を準備してください。たとえば、ビルダーの場合は保証を提供し、余分な RAM を用意してください。ユーザーの場合は、基本的にテストされていない新しいマシンに保存するデータのバックアップをいくつか保持してください。

関連する個人的な経験/逸話:

「RAM を 18 時間以上テストしました」 -- 私がシステム ビルダーとして働いていたとき、出荷前にすべてのシステムの RAM (およびシステム全般) を 72 時間連続 (最低) バーンインしていました。バーンインの 3 日目に RAM が故障することが何度もありましたし、その後も RAM が現場で故障することが何度もありました。これが現実です。

関連情報