저는 최근(약 일주일 전) 하드 드라이브(Seagate ST3000VN007)를 구입하고 SMART 모니터링을 설정했습니다. 배송 방법으로 인해 중요한 손상이 있는지 확인하기 위해 배드 블록도 사용했습니다.
오늘 보니 high fly write 개수가 의심스러울 정도로 높습니다(원시 값 39). "정보용" 매개변수라는 것은 알지만 새 디스크에 비해 너무 높은 것 같습니다.
걱정하고 드라이브를 반납해야 할까요, 아니면 이렇게 높은 숫자가 보이는 것이 정상일까요(왜?)?
전체 SMART 데이터는 다음과 같습니다.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 115 100 006 Pre-fail Always - 99844816
3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 5
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 317858
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 92
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 5
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 061 061 000 Old_age Always - 39
190 Airflow_Temperature_Cel 0x0022 067 064 045 Old_age Always - 33 (Min/Max 29/36)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 2
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 5
194 Temperature_Celsius 0x0022 033 040 000 Old_age Always - 33 (0 22 0 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
답변1
하이플라이가 쓴 숫자가 의심스러울 정도로 높은 걸 봤어요
정기적인 백업이 권장되며 다른 매개변수와 전반적인 드라이브 상태에 세심한 주의를 기울이십시오.
Back blaze가 "이 오류가 발생한 실패한 드라이브 중 상당수는 비슷한 수의 오류를 갖고 있었지만 훨씬 더 짧은 기간 동안 배포되었습니다(예: 1주일 동안 52개의 오류 발생)"라고 말했듯이 이 값을 자주 확인하는 것도 가치가 있습니다. 갑자기 SMART 189는 짧은 시간 동안 High Fly Writes 클러스터를 찾아 실패를 예측하는 데 매우 흥미로워 보입니다."
High Fly Writes SMART 매개변수는 드라이브 수명 동안 감지된 오류 수를 나타냅니다. HDD 생산업체는 기록 헤드가 정상 작동 범위를 벗어나는 경우를 감지하여 쓰기 작업에 대한 추가 보호 기능을 제공하는 플라이 높이 모니터를 구현합니다. 안전하지 않은 비행 높이 조건이 발생하면 쓰기 프로세스가 중지되고 정보가 하드 드라이브의 안전한 영역에 다시 쓰여지거나 재할당됩니다. 권장 사항
이 매개변수는 대부분의 하드웨어 공급업체에서 정보 제공용으로 간주됩니다. 이 매개변수의 저하가 드라이브 노후화 및/또는 잠재적인 전기기계적 문제를 나타내는 지표일 수 있지만, 이것이 임박한 드라이브 오류를 직접적으로 나타내지는 않습니다.정기적인 백업을 권장합니다. 다른 매개변수와 전반적인 드라이브 상태에 더욱 주의를 기울이십시오.
원천SMART 속성: High Fly Writes | 기술 자료
고려해야 할 또 다른 통계: SMART 189 – High Fly Writes
이것은 현재 우리가 사용하는 5가지 SMART 통계 목록에 포함될지 여부를 확인하기 위해 검토한 통계입니다. 이 통계는 레코딩 헤드가 정상 작동 범위를 벗어나는 횟수를 누적한 것입니다. 아래에는 SMART 189 원시 값이 0보다 큰 작동 및 고장난 드라이브의 비율이 나열되어 있습니다.
Failed Drives: 47.0% Operational Drives: 16.4%
0보다 큰 값을 갖는 작동 드라이브의 잘못된 긍정 비율은 언뜻 보기에 이 통계를 의미 없게 만드는 것처럼 보일 수 있습니다. 그러나 SMART 189 오류가 있는 대부분의 작동 드라이브에서 해당 오류가 오랜 기간 동안 상당히 고르게 분포되어 있다고 말하면 어떻게 될까요? 예를 들어 52주 동안 평균 일주일에 한 번의 오류가 발생했습니다. 게다가 내가 너한테 그런 말을 하면 어떨까?이 오류가 발생한 실패한 드라이브 중 상당수는 비슷한 수의 오류가 있었지만 훨씬 더 짧은 기간 동안 배포되었습니다(예: 1주일 동안 52개의 오류 발생).갑자기 SMART 189는 짧은 시간 동안 High Fly Writes 클러스터를 찾아 실패를 예측하는 데 매우 흥미로운 것처럼 보입니다. 우리는 현재 오류가 발생하는 비율의 유용한 범위를 정의할 수 있는지 확인하기 위해 SMART 189의 사용을 연구하는 중입니다.