私の Sunfire x2200 M2 には 250GB と 2TB の 2 つの SATA ドライブが搭載されています。昨夜か今朝のいつか、システムが自動的に再起動しました。正常に復帰しましたが、いくつかのログを確認したところ、次のことがわかりました。http://pastebin.com/Bctbzwb9。
da0
は 250GB ドライブで、OS ドライブです。 でドライブ情報を確認したところsmartctl
、すべて問題ないように見えましたが、 でテストを実行するとsmartctl
、読み取りエラーが発生して失敗しました。 その後、 で次のことに気付きましたvar/log/messages
。
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], 7 Currently unreadable (pending) sectors
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], 7 Offline uncorrectable sectors
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], previous self-test completed with error (read test element)
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], Self-Test Log error count increased from 0 to 1
これをどう解釈したらよいのかよくわかりません。これはドライブまたはコントローラーの故障のように見えますか?
smartctl -a /dev/da0
出力:http://pastebin.com/RJ6043KJ
答え1
ドライブが故障しているようです。
最新の SATA ドライブ (および古い SCSI ドライブ) には、セクターにチェックサムがあります。読み取ってチェックサムが一致しない場合は、データが再度読み込まれます。データの再読み取りが頻繁に失敗すると、ドライブはディスク上の物理セクターが不良であると想定します。
そのような事態が発生すると、次の 2 つのことが起こる可能性があります。
- ドライブはデータの回復を試み、正常に読み取られると、そのデータをスペアセクターに書き込みます。次に元のセクターを読み取ろうとすると、代わりにスペアセクターにリダイレクトされます。これが進行中で正常に完了していない場合、ステータスは保留中(あなたのログにある通り)。
- これが頻繁に発生すると、ドライブのスペア セクタが不足します。スペア セクタを使用できなくなり、読み取りエラーが発生します。
ログには および のエントリがありますcurrently unreadable (pending) sectors
。7 Offline uncorrectable sectors
これは明らかにケース 1) を指しているようです。