Linux ソフトウェア RAID の堅牢性

Linux ソフトウェア RAID の堅牢性

4 ディスク 5TB の RAID5 セットアップを使用していますが、ディスクが消耗しつつある兆候が見られます。メディア エラーが報告されており、dmesg からいくつかの読み取りエラーが修正されたことがわかります。smartctl は「通知」を報告しますが、今のところパニックにはなりません。新しいディスクは現時点ではかなり高価なので、Linux の md レイヤーがどの程度堅牢なのか考え始めています。

md が実際にディスク エラーを処理する方法について、どなたか説明していただければ幸いです。たとえば、md は書き込みエラーと読み取りエラーをどのように処理するのでしょうか。ディスクがアレイから拒否されるには (実際には) 何が必要ですか。また、最近 md が不良ブロックのマッピングをサポートしたと読みました。これは、カーネル >3.1 を実行していれば、私が経験した読み取りエラーがマッピングされていたことを意味しますか。それとも、md は引き続き「処理」して使用可能にしようとするのでしょうか。

答え1

データを大事にしたいなら、今すぐディスクを交換してください。すべてのサブシステムはデータ損失を防ぐために全力を尽くしますが、できることは限られています。不良ブロックを回避できるとしても、1つあれば他にも不良ブロックがあるはずです。

差し迫った問題についての大量の警告を受け取りました。それを無視することは、クライアントのデータに対して無責任な行為です。

コメントとしては長すぎるので編集します:

あなたの質問が本当は何なのか全く分かりません。警告が深刻なものかどうか知りたいのですか? はい、深刻です。それについて何かする必要がありますか? はい、今すぐに。

サブシステムが読み取りエラーを報告した場合、そのエラーは存在し、重要なものです。システムがまだエラーを修正できる場合でも、2 分後にはエラーが修正できなくなり、ディスクが障害としてマークされ、オフラインになる可能性が高くなります。

Linux md raid は、少なくともハードウェア RAID 実装と同じくらい信頼できますが、最良の状況でも RAID5 は危険な選択だと私は考えています。問題は、復元中に保護されないことです。これは RAID5 にとって非常に負担の大きい状況です。ディスクが故障しそうになると事前に警告が出るのに対し、ハードウェア RAID は事後にしか通知しない可能性があるため、一部のハードウェア RAID システムよりも信頼できると考えています。ソフトウェア RAID には、主にパフォーマンスの問題に関連する欠点がいくつかありますが、信頼性はそのうちの 1 つではありません。

いずれにせよ、これに関係なく、あなたのような状況に対する専門的なアプローチは、ディスクをすぐに交換することであり、それは私のプライベート ディスク アレイに対しても同様の対応をします (このような状況のために予備を用意しています)。

答え2

これは、当社の Dell サーバーの 1 つを使用した約 6 年前の体験です。当時は、ディスク障害をリモートで検出することができなかったため、ハードウェア RAID を使用していませんでした。

そこで、ソフトウェア RAID 1 (md) を使用しました。しばらくすると RAID が劣化しました。/var/log/messages を確認すると、特定のパーティションに関連する IO エラーのリストがあることがわかりました。

パーティションを RAID に再度追加しましたが、しばらくすると再び破棄されました。

私は /var/log/messages の出力を Dell サポートに送信し、すぐに新しいディスクを入手しました。これはサポートされていない Linux フレーバーであり、最も基本的なサポート レベルのみでした。

他に数台のマシンをセットアップしましたが、同じ問題に再び遭遇することはありませんでした (つまり、ディスクが故障することはありませんでした)。私にとって、これは md が信頼できるという証拠です。

これは 3.1 カーネルにも当てはまると思います (まだどれも持っていません)。

答え3

私の知る限り、mdadm は堅牢なソフトウェア RAID 実装であり、HD が良好な状態であれば、いかなる種類のエラーもほとんど発生しません。私は mdadm が構成されたサーバーを複数所有していますが、ログ ファイルに読み取りエラーが発生したことはありません。

アレイのステータスを次のように確認します。

mdadm --detail /dev/mdX

ただし、エラーの原因となっているドライブを交換することを強くお勧めします...

関連情報