偵測到記憶體資料損壞:問題出在哪裡?

偵測到記憶體資料損壞:問題出在哪裡?

我們的 SSD VPS 遇到崩潰,所有這些 VPS 都在 KVM 上運行:崩潰發生的原因有很多;為了急於恢復我的團隊使用的服務來重新載入電腦的先前快照,並且從不保存日誌。

不管怎樣,在所有不同的崩潰情況中,一個反覆出現的事實是corruption of in-memory data:我們的 VPS 提供者告訴我們他們的硬體運作良好,但我不知道如何閱讀給我的糟糕日誌。

在此輸入影像描述

偵測到「記憶體中資料損壞」時涉及什麼?是否是因為 RAM 損壞,或者有其他類型的記憶體損壞?

有趣的是:使用 VMware 的 VPS 提供者從來沒有給我們帶來麻煩,而使用 KVM 的 VPS 提供者卻因為這些崩潰而讓我們發瘋。

編輯1:我絕不要求你們從這個悲慘的日誌中推斷出解決方案。我遇到了這個問題,沒有提供像樣的日誌,memtest這是無用的,因為硬體是模擬的,並且 VPS 提供者承認他們的硬體很好,並且沒有 KVM 或 QEMU 實例崩潰。corruption of in-memory data detected困擾著我,我想不出任何有效的方法來進一步調查這個問題。

答案1

“偵測到記憶體資料損壞”不一定代表硬體 RAM 不好。它也可能表示某個區塊被錯誤地讀取或寫入,儲存發生了一些翻轉或出現其他故障,可能是檔案系統錯誤以及其他一些原因。

如果存在一些潛在的檔案系統損壞,恢復到快照可能無法解決問題;它稍後會再次出現。

相反,您應該使用xfs_repair檔案系統,但由於它是根檔案系統,您需要從安裝媒體啟動或您的 VPS 提供者提供的救援環境。

如果xfs_repair修復檔案系統失敗,您可以執行xfs_repair -L該命令來清除 XFS 日誌(該日誌本身可能已損壞),然後再次嘗試修復檔案系統。

相關內容