Beschädigung der Daten im Arbeitsspeicher erkannt: Wo liegt das Problem?

Beschädigung der Daten im Arbeitsspeicher erkannt: Wo liegt das Problem?

Wir erleben Abstürze auf unseren SSD-VPSes, die alle mit KVM arbeiten: Abstürze treten aus verschiedenen Gründen auf; in der Eile, den Dienst wiederherzustellen, lädt mein Team einen vorherigen Snapshot der Maschine neu und speichert die Protokolle nie.

Wie dem auch sei, unter all den verschiedenen Absturzumständen gibt es eine immer wiederkehrende Tatsache corruption of in-memory data: Unser VPS-Anbieter hat uns mitgeteilt, dass seine Hardware einwandfrei läuft, ich weiß jedoch nicht, wie ich das fehlerhafte Protokoll lesen soll, das ich erhalten habe.

Bildbeschreibung hier eingeben

Was ist zu beachten, wenn eine „Datenbeschädigung im Arbeitsspeicher“ festgestellt wird?Könnte es an einem defekten RAM liegen oder gibt es andere Arten von Speicherbeschädigungen?

Lustige Sache: Ein VPS-Anbieter, der VMware verwendet, hat uns nie Probleme bereitet, derjenige, der KVM verwendet, treibt uns wegen dieser Abstürze wirklich in den Wahnsinn.

Bearbeiten 1: Ich verlange keineswegs, dass Sie die Lösung aus diesem miserablen Protokoll ableiten. Ich stecke bei diesem Problem fest, bei dem kein anständiges Protokoll bereitgestellt wird, das memtestnutzlos ist, da die Hardware emuliert ist und der VPS-Anbieter zugesichert hat, dass seine Hardware in Ordnung ist und keine Instanzen von KVM oder QEMU abgestürzt sind. corruption of in-memory data detectedverfolgt mich und mir fällt kein produktiver Ansatz ein, um dieses Problem weiter zu untersuchen.

Antwort1

„Beschädigung der Daten im Arbeitsspeicher festgestellt“bedeutet nicht unbedingt, dass der Hardware-RAM defekt ist. Es könnte auch darauf hinweisen, dass ein Block falsch gelesen oder geschrieben wurde, der Speicher ein wenig umgedreht ist oder anderweitig ausfällt, möglicherweise Dateisystemfehler und einige andere Ursachen vorliegen.

Wenn eine latente Beschädigung des Dateisystems vorliegt, wird das Zurücksetzen auf einen Snapshot das Problem vermutlich nicht beheben; die Beschädigung wird später einfach erneut auftreten.

Stattdessen sollten Sie xfs_repairdas Dateisystem, aber da es das Root-Dateisystem ist, müssen SieBooten vom Installationsmediumoder eine Rettungsumgebung, die von Ihrem VPS-Anbieter bereitgestellt wird.

Wenn xfs_repairdie Reparatur des Dateisystems fehlschlägt, können Sie „) ausführen, xfs_repair -Lwodurch das XFS-Protokoll gelöscht wird (das selbst beschädigt sein kann) und dann erneut versucht wird, das Dateisystem zu reparieren.

verwandte Informationen