
潜在的な災害復旧モデルのテスト。
VMWare を使用して、基本構成のサーバーの OVF を取得します。これにより、基本 VM 構成 (CPU、メモリ、ディスク、OS など) が提供されます。必要に応じて VM をスタンプします。
毎晩、ディスクやパーティションの dd イメージを取得します。これにより、各サーバーのディスク イメージが提供されます。以下は、イメージ ファイルをキャプチャする方法の例です。この場合は、sda 全体をコピーしています。イメージ ファイルは、ネットワーク リソースにコピーされます。
dd if=/dev/sda | gzip -c >
したがって、理論的には、サーバーがダウンした場合には、VM 全体を最初からやり直す必要があり、テンプレートからデプロイしてからディスク イメージを適用する必要があります。この理論は妥当でしょうか?
問題が発生しています。ディスク イメージを適用した後、サーバーにディスク エラーやパーティション エラーが表示されます。エラーには次のようなものがあります。
blk_update_request: I/O エラー、デバイス fd0、セクター 0
dracut を起動する
これらのエラーを調べたところ、すべてディスク/パーティションの破損を示しています。では、何を間違えているのか、または考慮していないのでしょうか? もっと良い方法はありますか? Rsync を検討しています...
前もって感謝します...
答え1
dd を使用する際の問題は、変更中のハード ディスクからブロックをコピーすることです (一部のブロックはすでに書き込まれ、一部はまだキャッシュ内にあるなど、不整合な状態になります)。これにより、HDD が破損する可能性が高くなります。rsync を使用すると、ファイル システム レベルで状況が改善され、大きな前進となりますが、依然として不整合な状態 (一部のファイルは既に変更されていますが、一部は変更されていません) をコピーする可能性があります。最良のケースは、VM スナップショットを取得してそれをコピーすることです。