2 ディスク ソフトウェア RAID-1 のディスクがあり、最近 SMART ステータスに「オフラインの修正不可能なセクター」が表示されました。
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 1
どうやら、これが頻繁に発生するようになった場合、ディスク障害が差し迫っていることを示す兆候にすぎないようです (ドライブはミラーリングされているため、実際のデータ損失のリスクも大きくありません)。当時、セルフテストもどこかの時点で失敗し、smartd
当然のことながら、このことを通知する電子メールが送信されました。
ただし、損傷したセクターに書き込むと、通常、ディスクは代わりにスペア セクターの 1 つを使用します。dd
ディスクを消去してから、すべてのセルフテストが正常に実行されたことから、そのように思われます。また、badblocks
不満を言う理由も見つかりませんでした。
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
[...]
# 5 Extended offline Completed without error 00% 5559 -
# 6 Short offline Completed without error 00% 5540 -
# 7 Short offline Completed: read failure 90% 5524 63273368
不良セクターの数は減っていませんが、実際には減るはずがありません。壊れたセクターは未使用ではあるものの、まだそこに残っているからです。しかし、smartd
毎晩メールが届き続けます。
The following warning/error was logged by the smartd daemon:
Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
smartd
これは明らかに非常に迷惑で、メールに対する私の健全なパニック反射を麻痺させます。
ディスクは Western Digital WD20EARS で、smartd
バージョンは 5.41 2011-06-09 r3365 です。
答え1
一部のディスクでは、設定ファイルで-U 198+
(または?) に頼る必要がある場合があります。-U +
注意してください。あなたが最初の質問者ではない場合は、質問全体を注意深く読んでください。これを必要としないディスクでこれを使用すると、有効な警告が完全に抑制されます。
「+」が指定された場合、最後のチェック サイクル以降にセクター数が増加した場合にのみレポートが印刷されます。一部のディスクでは、不良セクターが再割り当てされてもこの属性はリセットされません。以下の「-v 198,increasing」も参照してください。
たとえば、 のデフォルト設定を使用しているとしますsmartd.conf
。その場合、ファイルには多くのコメントがありますが、コメント以外の行は次の行のみです。
# The word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices. DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found. Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN
行末にオプションを追加します:
DEVICESCAN -U 198+
答え2
これらのメールの送信元には 2 つの可能性があります。smartd は独自にメールを送信できますが、そのように設定されていない可能性が高いため、これらのメールは logcheck によって送信されていると想定しています。この想定が間違っている場合は、これ以上読む必要はありません。
logcheck はログ ファイルをスキャンし、システムで発生した問題に関して注意する必要があると判断した場合、メールを送信します。
特定のパターンに一致するメッセージを送信しないように logcheck に指示する logcheck 無視ルールを記述するオプションがあります。
Debian ベースのシステムでは、次の内容を含む「/etc/logcheck/ignore.d.server/smartd_own」というファイルを作成できます。
^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$
これにより、迷惑なメールがフィルタリングされますが、修正不可能なセクターのカウンターが増加した場合は再度通知されます。