![mdadm がディスクをドロップした理由を見つける](https://rvso.com/image/169427/mdadm%20%E3%81%8C%E3%83%87%E3%82%A3%E3%82%B9%E3%82%AF%E3%82%92%E3%83%89%E3%83%AD%E3%83%83%E3%83%97%E3%81%97%E3%81%9F%E7%90%86%E7%94%B1%E3%82%92%E8%A6%8B%E3%81%A4%E3%81%91%E3%82%8B.png)
過去 1 ~ 2 か月の間に、mdadm がディスクをドロップしたことが 2 回ありました。前回はディスクを再度追加し、しばらくは正常に動作していましたが、その後、再びデグレード モードで動作していることに気付きました。ドライブがドロップされた「理由」をどうやって見つけるか疑問に思っています。
答え1
システム ログ (通常は/var/log/messages
および/または コマンドの出力)を読む必要がありますjournalctl -xe
。ドライブが最近故障した場合は、カーネル メッセージ バッファ (コマンドで表示可能dmesg
) にもそのメッセージが含まれている可能性があります。
通常、dmesg
メッセージはログにも保存されますが、ロギング サブシステムが優先度の低いカーネル メッセージの一部を無視するように構成されている場合があり、出力に詳細が含まれる可能性がありますdmesg
。
おそらく、ディスク I/O エラー/タイムアウト メッセージが大量に表示され、その間またはその後に RAID サブシステムからドライブが故障しているとマークされているというメッセージが表示されます。基本的に、RAID サブシステムが、ディスクが何らかの理由で I/O (読み取りまたは書き込み) 要求に失敗している、またはタイムアウトしていると報告し始めたことを検出すると、ディスクは故障とマークされます。
smartctl -a
さらなる手がかりを得るには、ドロップされたディスクで を使用し、ディスク自体の内部ヘルスチェックでどのような結果が報告されているかを確認することもできます。