KVM 上で動作している SSD VPS でクラッシュが発生しています。クラッシュはさまざまな理由で発生します。サービスを復元するために急いでいるときに、私のチームはマシンの以前のスナップショットを再ロードし、ログを保存しません。
とにかく、さまざまなクラッシュ状況の中で、繰り返される事実は、corruption of in-memory data
VPS プロバイダーがハードウェアは正常に動作していると言ったのに、提供された質の悪いログの読み方がわからないということです。
「メモリ内データ破損」が検出された場合は何が起こりますか?RAM が壊れているからでしょうか、それとも他の種類のメモリ破損があるのでしょうか?
面白いことに、VMware を使用している VPS プロバイダーでは問題が発生したことがありませんが、KVM を使用しているプロバイダーでは、これらのクラッシュが原因で本当に困っています。
編集1: 私は、皆さんにこのひどいログから解決策を導き出すよう要求しているわけではありません。まともなログが提供されず、memtest
ハードウェアがエミュレートされ、VPS プロバイダーがハードウェアに問題がなく、KVM や QEMU のインスタンスがクラッシュしていないことを認めているため役に立たないこの問題で行き詰まっています。このcorruption of in-memory data detected
問題が私を悩ませており、この問題をさらに調査するための生産的なアプローチが思いつきません。
答え1
「メモリ内のデータの破損が検出されました」必ずしもハードウェア RAM が不良であることを意味するわけではありません。ブロックの読み取りまたは書き込みが誤っている、ストレージが少し反転している、またはその他の障害が発生している、ファイルシステムのバグなど、いくつかの原因が考えられます。
潜在的なファイルシステムの破損がある場合、スナップショットに戻しても問題は解決しない可能性があり、後で再び現れるだけです。
代わりに、xfs_repair
ファイルシステムを復元する必要がありますが、ルートファイルシステムなので、インストールメディアから起動するまたは、VPS プロバイダーが提供するレスキュー環境。
xfs_repair
ファイルシステムの修復に失敗した場合は、xfs_repair -L
これを実行して XFS ログ (それ自体が破損している可能性があります) をクリアし、再度ファイルシステムの修復を試行してください。