DL380 G5、RAID5、ext3、RAID 障害

DL380 G5、RAID5、ext3、RAID 障害

当社には、外部ベイに RAID5 アレイで 5 つの 300 GB SCSI 3.5 インチ ディスクが搭載され、ext3 ファイルシステムで論理ボリュームとしてフォーマットされた古い HP DL380G5 サーバーがあり、1.2 TB の機密性の高い臨床患者データをホストしています。

hpacucli で 2 つのディスクが予測障害を示したため、まず 1 つを交換して問題がないことを確認しましたが、「再構築の準備完了」と表示されていることに気が付きませんでした。まったくの不注意で 2 つ目も交換してしまい、RAID が失敗したと表示されます。

古いディスクを戻して、サーバーを再起動しようとしましたが、起動中に回復モードになり、論理ボリュームが見つからないというメッセージが表示されます。

これを復元するために何かできることはありますか? 残念ながらバックアップはありません。 ご協力いただければ幸いです。

古いドライブを両方とも返却しようかと考えていましたが、これで RAID が復活する可能性はありますか?

答え1

申し訳ありませんが、これは操作ミスです。

RAID5 アレイ上の 2 つのディスクに障害が発生し、アレイが維持できる以上のディスクを削除しました。

バックアップなしでこれを行うのは、より大きな間違いです。

壊れた論理ドライブからデータを回復するには、データ復旧会社に連絡する必要があります。

答え2

システムの電源を再びオンにしないでください。シャットダウンして、データ復旧サービスを呼び出してください。このタイプの障害のリモート復旧を可能にするサービスは多数あります。この時点でできることは、状況を悪化させることだけです。

これには、すべてのドライブを既知の正常な HBA (RAID カードや他のコントローラーではありません) に直接接続し、リモート管理ツールを使用して特定のダウンロード可能な Linux イメージを開始することが含まれます。次に、会社はシステムにリモート アクセスし、ディスクの状態を評価し、残っている RAID メタデータを回復します。独自のソフトウェアを使用して、仮想 RAID ディスクを再構築できます (技術的な詳細: 多くの場合、標準の Linux デバイス マッパー システムにプラグインするもの)。これにより、RAID がソフトウェア内で読み取り専用になります (RAID SoC アクセラレータなし)。次の手順では、データが使用できないほど破損していないことを確認し、仮想ディスクを新しいディスクに複製してデータ回復を完了します。その後、システムを再び起動して実行することに専念できます。

ここではサービス名を挙げませんが、ほとんどのサービスは簡単に見つかります。リモート サービスがあるサービスでは (RAID ドライブとリカバリ ドライブを送付して、リカバリとクローンを待ってから返送するという往復の手間が省けます)、データが実際に施設から出ていくことがないというメリットがあります。


ちょっとした朗報です。RAID コントローラー (またはユーザー) がディスクに新しいデータを書き込んでおらず、障害前警告が障害警告でない限り、優れたデータ復旧チームがすべてを復旧できる可能性は実質的に 99.9999% あり、しかもかなり迅速に復旧できます。

答え3

Re: 古いドライブの復元。

現状では RAID は完全に機能していないため、故障前の 2 つのドライブを再装着しても失うものはほとんどありません。

元のベイにインストールしてください。

これらは完全に故障するものではなく、故障前のものであることを覚えておいてください。そのため、データを救出するのに十分な時間稼働する可能性は十分にあります。

RAID が起動しない可能性や、コントローラが RAID を「リセット」するように要求する (NO/CANCEL を選択) 可能性がわずかにあります。また、RAID コントローラが RAID を自動的にリセットする可能性もわずかにあります。この場合、データ復旧会社によって追加された価値が無効になります。

したがって、RAID が起動した場合の最優先事項は、データを取り出すことです。つまり、少なくとも 1.2 TB の空き容量があり、データをコピーする準備ができており、Linux の場合はrobocopyまたはなどのツール を実行できる状態であることを意味します。ドライブが最後の数分間を無駄にしている場合、マニュアル ページを読んだり構文を理解したりするのに時間を無駄にしたくないでしょう。xcopy32rsync


データが安全になったら、新しいドライブを使用して RAID を RAID6 として再作成します。容量は 300 GB 減りますが、2 つのドライブの許容範囲が得られます。または、ドライブを追加して、6 つのドライブで RAID10 を検討してください。または、このマシンを完全に廃止することを検討してください。G5 は 10 年以上前のもので、重要な生産タスクにはもはや適していません。

追い詰めるつもりはありませんが、適切なバックアップ ソリューションも設定してください。次回は必ず来ます。

関連情報