メモリの欠陥により報告されていないエラーが発生する可能性がある

メモリの欠陥により報告されていないエラーが発生する可能性がある

「RISER DIMM X で修正不可能なメモリ エラーが以前に検出されました」というメモリ エラーが時々表示されます。

過去半年間で 2 回だけ発生しました。発生すると、システムがクラッシュし、次回の起動時にメッセージが報告されます。その後、エラーは消えます。再現性はないようです。

何かがおかしいのは間違いありません。Web 検索で、メモリかマザーボードのどちらかに問題があることが分かりました。しかし、この問題は断続的に発生するため、原因が何なのか、また使用状況に影響があるかどうかを把握するのは非常に困難です。

質問: システムがクラッシュしない場合、プログラムが誤った結果を生成している可能性はありますか? たとえば、データベースまたは計算プログラムを実行している場合、システムがクラッシュしなくてもプログラムが誤った結果を生成し、そのことに気付かない可能性はありますか?

もしそうなら、問題が断続的であるという事実は特に心配です。なぜなら、プログラムがいつ正しい結果を生成し、いつそうでないのかがわからないからです。

答え1

はい、それは十分あり得ます。ただし、永続的なメモリ エラーによってシステムが定期的にクラッシュしない可能性は低いです。メモリ管理は決定論的ですが、コンピュータの使用方法はそうではありません。;) そうすると、プログラム (およびそのワーキング セット) は、起動するたびにほぼ毎回異なるメモリ位置に表示されます。

メモリの障害により、ディスクへの DMA 転送用にマークされたデータがメモリ内で破損すると、ディスク破損が発生する可能性もあります (実際に発生します)。これは、私の意見では、はるかに危険です。なぜなら、データが必要になったときに破損していることに気付くまで、何年もこれらのエラーに気付かない可能性があるからです。

関連情報