ホットスペア付きの RAID 5 か、ホットスペアなしの RAID 10 か?

ホットスペア付きの RAID 5 か、ホットスペアなしの RAID 10 か?

はい、これは「私の仕事を代わりにやって」という質問の 1 つです。同情してください:)

多額の費用をかけずにサーバーのハード ドライブの数でできることはもう限界です。構成するドライブがあと 4 つ残っていますが、RAID 5 として設定してホット スペアを専用にするか、ホット スペアなしで RAID 10 にするかを選択できます。それぞれのサイズは同じで、RAID 5 で十分なパフォーマンスが得られます。

私は RAID 5 には疎いのですが、ホット スペアなしで稼働させるのも好きではありません。パフォーマンスの低下にはそれほど関心がありませんが、システムが十分な冗長性を持たない時間の長さには関心があります。サーバーとドライブは、13x5 4 時間対応の契約になっています (ただし、最寄りのサービス プロバイダーは、冬季には車で少なくとも 2 ~ 3 時間かかることは知っています)。

サーバーには 2 つの RAID 1 アレイがあり、これもホット スペアによって保護されることにも注意してください。なぜ 9 ベイのドライブ ケージを作らないのでしょうか。

答え1

アレイのダウンタイム許容度はどの程度ですか? 物理的に近いですか、それともリモート データ センター内ですか? 基本的に、許容できる場合は、コールド スペアを使用して RAID10 を実行できます。スペアは近くにありますが、物理的にスワップする必要があります。これが許容できないシナリオである場合、ホット スペアを使用した RAID5 が唯一の答えとなります。

すでに 1 ドライブの障害耐性を持つ 2 つの RAID1 セットがあるため、ホット スペアのない RAID10 に移行しても実際には何も得られません。アレイ全体は、依然として 1 つのドライブ障害しか耐えられません。

答え2

これらの RAID はすべて、アレイ内のディスクとコントローラーが同じであると想定して、互いに相対的です。

  • Raid5: 読み取り速度は良好ですが、書き込み速度は遅いです。障害が RAID の再構築に十分な時間にわたって発生した場合、二重ディスク障害にも耐えることができます。(つまり、ディスク障害、RAID 再構築、ディスク障害、問題ありません)。二重ディスク障害が同時に発生した場合、障害の 1 つがホット スペアでない限り、SOL です。4 つのディスク アレイでは、二重ディスク障害の半分で 1 日が台無しになります。

  • Raid6: 読み取り速度は良好ですが、書き込み速度は非常に遅いです。二重ディスク障害にも耐えられます。他の RAID ほど一般的には実装されていません。

  • Raid10: 読み取りおよび書き込み速度が良好で、単一のディスク障害にも耐えることができ、(4 ディスク RAID の場合) 潜在的な二重ディスク障害の半分にも耐えることができます。

  • 3 方向ミラー + ホット スペア: スペースが大幅に少なく、ミラーが 1 回再構築されるのに十分な時間にわたって障害が発生した場合、2 つのディスク障害や最大 3 つのディスク障害にも耐えることができます。この機能をサポートするコントローラーやオペレーティング システムがいくつあるかはわかりませんが、これは ZFS より前に Solaris の MD 機能で使用していた機能です。

これを見ると、いくつか心配すべき問題があります。

  1. アレイの再構築にはどのくらいの時間がかかりますか? Sun は、状況によっては RAID5 アレイの再構築にかかる時間がアレイ内のディスクの MTBF よりも長くなり、ディスク障害がアレイ障害につながることがほぼ確実であることに気付いたときに、ZFS の開発を開始しました。

  2. 同じ製造ロットのディスクにはすべて同じ欠陥がある可能性があります(パレットが落とされたか、ディスクを作るときにプラッターに接着剤を塗った

  3. RAID アレイが複雑になるほど、コントローラ/実装上のソフトウェアも複雑になります。故障したディスクがアレイをダウンさせるのと同じくらい多くの RAID コントローラがアレイをダウンさせるのを見てきました。個々のディスクが何年も回転しているのを見てきました。実際、ほとんどのディスクがそうなります。私が今までに経験した中で最も信頼性の高いシステムは、冗長性のないボックスで、コンポーネントに障害が発生したことはありませんでした。UPS や RAID、冗長性 (ランダムなコンポーネントを挿入) が障害を引き起こすのを何度も見てきました。システムが複雑になりすぎて、その複雑さが障害の原因になったからです。

お金を払えばチャンスをつかむ...問題は、

幸運を感じますか?

答え3

私は CHopper3 には同意できません。この状況ではドライブが 4 つしかないため、どちらのシナリオでも障害の可能性は同じ (ドライブ 2 つ) ですが、RAID 10 では、誤って 2 つのドライブを失ってしまった場合、深刻な問題になります。また、他の RAID 用のグローバル スペアがあることには、間違いなく追加のメリットがあります。

答え4

他にも考慮すべき点がいくつかあります。各ドライブの大きさや速度はどれくらいでしょうか。1TB SATA ドライブは、RAID5 のホットスペアから再構築するのに永遠に 1 日かかる可能性があり、2 番目のドライブが故障する可能性が高くなります。

パフォーマンスは問題ではないとおっしゃっていますが、RAID5 の再構築中 (特に書き込み時) にかなりのパフォーマンスの低下が発生しているのを確認しています。

関連情報