최근 SMART 상태에 "수정할 수 없는 오프라인 섹터"가 나타난 2개 디스크 소프트웨어 RAID-1에 디스크가 있습니다.
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 1
이는 점점 더 자주 발생하는 경우 디스크 오류가 임박했다는 신호일 뿐입니다(드라이브가 미러링되므로 실제 데이터가 손실될 위험도 크지 않습니다). 당시 자체 테스트도 어느 시점에서 실패했으며 smartd
당연히 그래야 함을 알리는 이메일을 나에게 보냈습니다.
그러나 손상된 섹터에 쓰면 일반적으로 디스크가 예비 섹터 중 하나를 대신 사용하게 됩니다. dd
디스크를 덮어쓴 이후로 모든 자체 테스트가 정상적으로 진행되었기 때문입니다. 그리고 badblocks
불평할 이유도 찾지 못했습니다.
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
[...]
# 5 Extended offline Completed without error 00% 5559 -
# 6 Short offline Completed without error 00% 5540 -
# 7 Short offline Completed: read failure 90% 5524 63273368
결함이 있는 섹터의 수는 줄어들지 않았지만 실제로는 사용되지 않더라도 손상된 섹터가 여전히 남아 있기 때문에 감소해서는 안 됩니다. 그러나 smartd
매일 밤 계속 이메일을 보냅니다.
The following warning/error was logged by the smartd daemon:
Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
이것은 매우 짜증나는 일이며 smartd
메일에 대한 건강한 공황 반사를 마비시킵니다.
디스크는 Western Digital WD20EARS이고 smartd
버전은 5.41 2011-06-09 r3365입니다.
답변1
일부 디스크에서는 구성 파일의 -U 198+
(또는 ?) 를 사용해야 할 수도 있습니다 .-U +
주의하시기 바랍니다. 귀하가 원래 질문자가 아닌 경우 전체 질문을 주의 깊게 읽으십시오. 필요하지 않은 디스크에서 이를 사용하면 완전히 유효한 경고가 표시되지 않습니다.
'+'를 지정하면 마지막 점검 주기 이후 섹터 수가 증가한 경우에만 보고서가 인쇄됩니다. 일부 디스크는 불량 섹터가 재할당될 때 이 속성을 재설정하지 않습니다. 아래 '-v 198,increasing'도 참조하세요.
예를 들어 에서 기본 구성을 사용한다고 가정합니다 smartd.conf
. 이 경우 파일에 많은 주석이 있지만 주석이 아닌 유일한 줄은 다음과 같습니다.
# The word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices. DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found. Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN
줄 끝에 옵션을 추가합니다.
DEVICESCAN -U 198+
답변2
이러한 메일의 출처는 두 가지 가능성이 있습니다. smartd는 자체적으로 메일을 보낼 수 있지만 이렇게 구성되지 않았을 가능성이 높으므로 이러한 메일은 logcheck를 통해 전송되는 것으로 가정합니다. 이 가정이 틀렸다면 더 이상 읽을 필요가 없습니다.
logcheck는 로그 파일을 검사하고 시스템에 발생한 모든 일에 대해 걱정해야 한다고 생각하면 메일을 보냅니다.
특정 패턴과 일치하는 메시지를 보내지 않도록 logcheck에 지시하는 logcheck 무시 규칙을 작성할 수 있는 옵션이 있습니다.
(Debian 기반 시스템에서는) 다음 내용으로 "/etc/logcheck/ignore.d.server/smartd_own"이라는 파일을 만들 수 있습니다.
^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$
이렇게 하면 성가신 메일이 필터링되지만, 수정할 수 없는 섹터 카운터가 증가하면 다시 알려주세요.