RAID1 mdadm は、ドライブを自動的に故障させ、読み取り専用ファイルシステムを回避しますか?

Question

デフォルトでそうなりますが、確かに、私もこれに関して同様の問題を抱えていました。MD は、故障したディスクをあまり積極的に検出しません (または、ハードウェア RAID コントローラが行うように、セクターを書き換えて修復しません)。そのため、ログ監視を設定して、「ata 例外」をスキャンし、発生したときに電子メールで通知するようにしています。少なくとも従来の HDD では、これによりディスクの故障をはるかに早く確認できます。

ファイルシステムが読み取り専用としてマークされている場合、エラーはチェーンの上位に伝わり、MD デバイスでもエラーが発生しています。sdb にエラーがなかったことは確かですか?

それとも、ドライブが故障したと確信していますか? つい最近、私の身に起こったことですが、PCI バス全体が故障したことがあります。それに接続されているすべてのデバイス (すべての ATA とイーサネット) がエラーを吐き出し始め、実際にファイルシステムは読み取り専用としてマークされ、MD アレイは故障しました。しかし、明らかにディスクや MD は問題ではありませんでした。

ドライブにエラーがあったかどうかを確認するには: SSD ドライブの SMART についてはあまり経験がありませんが、少なくとも HDD ドライブでは、SMART ログに何かが表示される可能性があります。そこにはエラーログがあり、スマートパラメータを確認して、他のディスクと比較することができます。

smartmontools がインストールされている場合は、次の操作を実行できます。

smartctl -a /dev/sda

あなたも興味があるかもしれませんRAIDアレイのトラブルシューティング方法。

編集: PCI バスに関してですが、問題は 1 つのディスクまたはコントローラに限定されているようです。

Answer 1