イメージからの無人リカバリ

イメージからの無人リカバリ

イメージから復元する必要のあるマシンがかなりあります。これらのマシンはさまざまな場所にあり、キーボードがなく、場合によってはディスプレイさえも隣にないことがあるため、完全に無人状態で回復を行う必要があります。

詳細: マシンはサーバーではありません。AMT はありますが、それ以上のものではありません。Ghost には LightsOut と呼ばれるものがあると読んだことがありますが、ボックスにインストールする必要があるため、問題外です。

私の理想的なソリューションは、ディスク全体のイメージ (ディスクはどこでも同じです。複数のパーティションがありますが、レイアウトもすべてのボックスで同じです) を作成し、USB フラッシュ ドライブからの起動に適した起動可能なリカバリ ISO を作成し、「リカバリ ディスクを取り外して再起動してください」というメッセージ以外の質問を一切表示しないソフトウェアです。技術者以外の人が、技術者からのリモート支援のみでリカバリを実行できるようにするというアイデアです。ここでは AMT が役立ちます。

SystemRescueCD をブート、SSH、ディスクの復元に適用するアイデアを検討してきましたが、完全な既存のソリューションの方がはるかに望ましいです。私が望むことを実現するものはありますか?

答え1

この質問は定期的に出てきますが、あなたの説明からすると、リモート ハンドが利用できるという点で状況が少し異なると思います。通常、答えは「周辺機器なしで OS が正しく動作する保証がないため、これを行うのは運次第です。エラーが発生した場合、誰も助けることができず、リモートでロックアウトされるリスクがあります...」です。

AMT が何なのかわかりません。どのオペレーティング システムを実行しているのかわかりません。UNIX ベースの場合は、DD を実行してディスクをファイルにイメージ化し、そのイメージに戻るには、イメージをドライブに逆 DD で戻すだけです。ドライブがアンマウントされ、システムが完全にメモリから実行されている

その場合、従うべき手順を書いておくことができます。私は Rescue Is Possible Linux (RIP) を使用してこの方法でいくつかのディスクを復旧しました。起動し、root としてログインし、パスワードを設定して /usr/sbin/sshd を実行し、IP を取得します (IP がまだない場合は netconfig を実行します)。その後、リモート共有をマウントしてコピーします (または USB デバイスをマウントします)。

ファイルシステムをアンマウントし、メモリ内で OS を実行しながらこのリカバリを実行することでリモートでリカバリを実行したという話を聞いたことがあります。ただし、非常にリスクが高いことに注意してください。ルーターが突然停止したり、ネットワーク カードがリセットされたり、ディスクに問題があってエラーが吐き出されていてもそれが見えない場合など、何時間もかけて作業した作業が台無しになり、マシンへの完全なアクセスが失われる可能性があります。

さらに、ディスクが交換される場合、セクター/ヘッド/シリンダの数が不安定になる可能性があり、DD には元の MBR のコピーが含まれることになるため、イメージが完全には機能しない可能性があります。多くのイメージング ユーティリティ (dd、partimage、gparted など) では、このことが問題となります。

検討すべきオプションは、これらのシステムを再構築してメモリから実行し、ハードディスクをデータ ストレージ領域としてマウントすることです。Devil Linux (そう呼ばれていたと思います) とよく似ています。CD から実行するディストリビューションを使用して Squid サーバーやメール サーバーなどを作成できます。また、データ専用のローカル ディスク (必要な場合) をマウントします。誰かがシステムをクラックしても、CD は読み取り専用であるため、独自のバイナリをインストールすることはできません。新しい CD を使用して再起動するだけで更新が簡単になります (構成は読み取り専用メディアまたは構成ファイルのみを保持する USB ドライブに保存でき、簡単にバックアップできます)。

また、OS を外付けドライブ (Linux ベースの場合) から実行したり、リムーバブル ドライブから実行したりすることもできます。その後、アップグレード/更新/復元してドライブをリモート ロケーションに送るだけで済みます。交換可能なディスクの場合は、エンド ユーザーは 1 つのディスクをスライドさせて取り出し、新しいディスクを挿入するだけです。

何があろうとも、あなたは手順をテストする必要がある「理論上は」という前提で考え、実際に復元しようとして失敗してしまうことは非常によくあります。電話の反対側にある NIC とハードディスクを区別できないユーザーと作業しているときに、復元が使用できないことに気付くのは間違いです。

最後の選択肢は、ベアメタルからシステムを回復するフル バックアップ パッケージ (Linux ベースのものなら Amanda など、Windows には多数のオプションがあります) を検討することです。ベアメタル回復では、通常、回復ディスクから起動して、最新のバックアップからデータを取得できます。Ghost やその他のイメージング ツールは、実際にはイメージング ユーティリティであり、データのバックアップではありません (さらに、イメージは大量のデータを必要とし、前述したように、回復が必要なプロセスでディスクのブランドやサイズが変わると問題が発生する可能性があります)。商用バックアップでは、差分バックアップとシステム状態バックアップが可能で、回復に役立ちます。

私が今好むようになったのは、OS をアプリケーションやデータから可能な限り分離する方法を見つけることです。そうすれば、OS をデータとは別に実行でき、回復や新しいシステムへの移行が簡単になります (これは、Devil Linux が CD からメモリ内で OS を実行し、データがドライブまたは外部ドライブから実行されるという点で似ています。そのため、OS が CD に含まれているだけで、データの移行やバックアップが簡単に行えます)。Linux は、OS を /root、/bin、/sbin (システム バイナリ) に設定し、データとログを保持する別のディスクを設定するように設定できます。

これらがあなたにとって役立つことを願っています...

答え2

ハードウェア メーカーが行っているように、プライマリ パーティションが破損したときに起動できる回復パーティションを作成することもできます。これにより、既知の場所から起動できるようになり、メイン パーティションを既知の正常な場所 (Ghost イメージなど) に復元するために必要なツールがそこに用意されます。

これを行うのに十分な低レベルでホストにアクセスできない場合は、TCP/IP 経由で動作する KVM スイッチもあります。これらは高価ですが、問題が発生するたびに技術者を派遣するよりは安価です。これは、あなたが言及した AMT に似ているかもしれませんが、私は AMT の経験がありません。

答え3

何年も前から、大量のマシンをリフレッシュするために私が使っていた方法は、Ghost と標準マシン イメージを含むブート可能な CD (そう、当時はイメージが小さかったのです) を作成することでした。バッチ スクリプトは、イメージをコピーして完了時に終了するオプションを指定して、コマンド ラインから Ghost を起動します。その後、バッチ ジョブは CD を取り出し、再起動します。技術的には、最初にブートアップ メニューがあり、自動的にイメージ作成が開始される前に、通常どおりブートするかどうかをユーザーに選択する 30 秒の猶予が与えられます。これは、迅速なリフレッシュ (コピーをいくつか作成し、マシンに挿入して、あとは勝手にやらせる) に使用されていましたが、システムを再起動してイメージで実行するまで、ユーザーの介入がまったく必要ないことが、あなたが探している領域に入ると思われます。

関連情報