我們的 SSD VPS 遇到崩潰,所有這些 VPS 都在 KVM 上運行:崩潰發生的原因有很多;為了急於恢復我的團隊使用的服務來重新載入電腦的先前快照,並且從不保存日誌。
不管怎樣,在所有不同的崩潰情況中,一個反覆出現的事實是corruption of in-memory data
:我們的 VPS 提供者告訴我們他們的硬體運作良好,但我不知道如何閱讀給我的糟糕日誌。
偵測到「記憶體中資料損壞」時涉及什麼?是否是因為 RAM 損壞,或者有其他類型的記憶體損壞?
有趣的是:使用 VMware 的 VPS 提供者從來沒有給我們帶來麻煩,而使用 KVM 的 VPS 提供者卻因為這些崩潰而讓我們發瘋。
編輯1:我絕不要求你們從這個悲慘的日誌中推斷出解決方案。我遇到了這個問題,沒有提供像樣的日誌,memtest
這是無用的,因為硬體是模擬的,並且 VPS 提供者承認他們的硬體很好,並且沒有 KVM 或 QEMU 實例崩潰。corruption of in-memory data detected
困擾著我,我想不出任何有效的方法來進一步調查這個問題。
答案1
“偵測到記憶體資料損壞”不一定代表硬體 RAM 不好。它也可能表示某個區塊被錯誤地讀取或寫入,儲存發生了一些翻轉或出現其他故障,可能是檔案系統錯誤以及其他一些原因。
如果存在一些潛在的檔案系統損壞,恢復到快照可能無法解決問題;它稍後會再次出現。
相反,您應該使用xfs_repair
檔案系統,但由於它是根檔案系統,您需要從安裝媒體啟動或您的 VPS 提供者提供的救援環境。
如果xfs_repair
修復檔案系統失敗,您可以執行xfs_repair -L
該命令來清除 XFS 日誌(該日誌本身可能已損壞),然後再次嘗試修復檔案系統。