記憶體故障可能會導致未報告的錯誤

記憶體故障可能會導致未報告的錯誤

我偶爾會看到這些記憶體錯誤:「之前在 RISER DIMM X 中偵測到不可修正的記憶體錯誤」。

近半年來只發生過兩次。當發生這種情況時,系統崩潰並在下次啟動時報告該訊息。然後錯誤就消失了——它似乎不可重複。

毫無疑問,有些地方出了問題。網路搜尋顯示,要嘛是我的記憶體有問題,要嘛是主機板有問題。但考慮到問題的間歇性,很難弄清楚它是什麼,以及它是否會影響我的使用。

問題:如果系統沒有崩潰,我的程式是否可能產生錯誤的結果?例如,如果我正在運行一個資料庫或計算程序,是否有時這些程序可能會產生錯誤的結果而不導致系統崩潰,而我永遠不會知道這一點?

如果是這樣,那麼問題是間歇性的這一事實尤其令人擔憂,因為我不知道程序何時產生正確的結果,何時不產生正確的結果。

答案1

是的,這是很有可能的,儘管系統不太可能不會因永久性記憶體錯誤而定期崩潰。雖然記憶體管理是確定性的,但您使用電腦的方式卻不是。 ;) 這樣,程式(及其工作集)幾乎每次啟動時都會出現在不同的記憶體位置。

當標記為 DMA 傳輸到磁碟的資料在記憶體中損壞時,故障記憶體也可能(並將會)導致磁碟損壞。在我看來,這要危險得多,因為您可能多年都沒有註意到這些錯誤,直到您需要資料並發現它已損壞。

相關內容