RAID 5 ディスク アレイでは、ドライブを回復すると別のドライブが故障する可能性が高くなりますか?

RAID 5 ディスク アレイでは、ドライブを回復すると別のドライブが故障する可能性が高くなりますか?

3 台以上のハード ドライブで構成される基本的な RAID 5 アレイがあり、そのうちの 1 台が故障した場合、他のドライブの 1 台が故障して完全な復旧が不可能になる可能性が高くなりますか? 復旧プロセス中にすべてのドライブが読み取られている場合、それらのドライブが 1 日のうちのほんのわずかな時間しかアクティブでないと仮定すると、故障する可能性は高くなりますか?

これがリカバリ中の安定性に影響する場合は、代わりに RAID 6 を検討するかもしれません。また、RAID 4 の代わりに RAID 5 を使用することで、何か利点や欠点はありますか? RAID 4 を使用する方が整理されていて、RAID 5 を使用する方が分散しているように思われるだけです。

答え1

まず、パリティ RAID を設定している場合は、RAID 6 よりも自動バックアップ スキームを備えた RAID 5 をお勧めします。バックアップは、複数のドライブ (推奨)、RAID 0 (非推奨)、または別の RAID 5 に行うことができます。これにより、コントローラーの障害や人為的エラーにも対処できるため、コストとデータの安全性のバランスが取れます。

安全に実行できるかどうかは、配列のサイズによって異なります。

IT 業界の多くは、2 つの理由から RAID 5 から離れつつあります。まず、アレイの多くはサイズが大きいため、再構築に非常に長い時間が必要となり、2 度目の障害が発生する可能性が高くなります。2 つ目は URE の問題です。これは回復不能な読み取りエラーで、ブロックの読み取りに失敗してそのドライブのアレイ全体が読み取り不能になるまでわかりません。繰り返しますが、読み取りビットあたりのエラー数からすると URE はめったに発生しませんが、TB サイズのアレイの場合、めったに発生しないということはあまりありません。URE のあるドライブからアレイを再構築することはできません。そのため、障害が発生し、さらに URE がある場合、実質的に 2 つのドライブが故障していることになります。RAID 6 は、2 つのドライブを失ってもアレイを再構築できるため、この点に役立ちます。

ただし、RAID 5 に 100 GB のアレイがある場合は、これらの問題は大幅に減少し、RAID 5 がより実行可能になります。ただし、RAID 6 に 100 TB のアレイ (単なる例) がある場合は、さらに冗長性を高めるか、別のオプションが必要になる可能性があります。

TB アレイの RAID 5 は間違いなくギャンブルであり、信頼できません。また、アレイをすぐに拡張する予定があり、コストのために一度に 1 ドライブずつ拡張する必要がある場合を除き、RAID 10 ではなく 4 ドライブの RAID 6 を実行するのは意味がありません。また、複数の RAID 1 アレイを実行できることも忘れないでください。これは、データを別々のパーティション/ディスクに分離して操作するだけであり、1 つの大きなドライブの利便性が失われます。

しかし、何事にも注意点があります。RAID 5 が大きくなるほど、2 台目のドライブの故障または URE による再構築の失敗の可能性が高くなります (指数関数的に高くなります)。RAID 6 はコストと複雑さが増します。RAID 10 はさらにコストが高くなります (ただし、シンプルさのためです)。そして、複数の RAID 1 は利便性の代償となります。

最終的には、ニーズを特定し、失ってはならないものと失っても構わないものを区別する必要があります。予算と専門知識のレベルに合わせて、どのアレイを選択するかを決めます。

当社では、安全のため毎日バックアップするために、オフィスと自宅のデータを RAID 1 (実際は MD RAID を使用した 2 ドライブ RAID 10) に保存しています。これはシンプルで高速、かつ信頼性があります。ビデオ ファイルやその他の重要でない大容量ファイルなどのその他のデータは、データの重要度に応じて RAID 5 または単一ドライブに保存し、時折バックアップします。これは、家族の写真や会社のファイルと同じレベルの安全性を映画に求めたくないためです。

答え2

RAID アレイの再構築には長い時間 (数日) かかることがあり、ディスクに大きな負担がかかります。この再構築中は、動作中のため、残っているディスクが故障しやすくなります。

再構築が開始される前は、残存ディスクが故障する可能性は高くありません。

このため、システムに「ホット スペア」を配置することは、自動的に再構築をトリガーして障害を引き起こすため、お勧めできません。また、再構築中に回復不可能な読み取りエラーが発生すると、他のディスクに障害が発生していなくてもアレイ障害が発生する可能性があります。最近のバックアップがない場合は、まずアレイからデータをコピーしてから再構築する方がよいでしょう。

答え3

短い答えは「はい」です。RAID 1+0 は、RAID5 の再構築中に障害が発生する可能性を考慮して特別に設計されました。

長い答え - はい、ドライブが故障する可能性が高くなります。「最も明白/単純な」ケースでは、発生する熱が多くなり、故障の可能性がわずかに高くなると言えます。とはいえ、これは実際のリスクではありません。

実際のリスクは、ドライブがほぼ同時に購入された場合、ドライブがほぼ同時に故障する可能性が非常に高くなることです。したがって、再構築中に 2 番目のドライブが故障する可能性が高くなります。残念ながら、このシナリオは理論的なものではありません。ドライブが大きいほど、再構築に時間がかかり、故障の可能性が高くなります。RAID5 は、大規模なディスク プールではほとんどメリットがないと一般に認められています。受け入れられているソリューションは、RAID 10 (RAID 1 1+0 と読みます) です。これは基本的に、2 セットのアレイにわたって 2 つの同一のデータ セットを構築します。したがって、RAID5 よりも多くの (ほぼ 2 倍) スペースを使用しますが、残念ながら大容量ドライブでよくあるマルチドライブ障害に対する保護が大幅に強化されます。

関連情報