SMART 속성을 통해 드라이브의 신뢰성 진단

Question

197 Current_Pending_Sector 값은 8이었지만 드라이브를 0으로 만든 후에는 값이 0으로 되돌아가고 196 Real located_Event_Count는 0입니다.

이는 어느 시점에서 드라이브가 일부 섹터를 읽는 데 문제가 있었지만 드라이브를 0으로 만든 이후로는 아무런 문제도 발생하지 않았음을 의미합니다. 전체 드라이브를 새로운 데이터로 덮어쓰면 섹터가 재할당 보류 상태에서 정상 상태로 바뀌었고, 그 시점에서 섹터가 재할당되지 않았기 때문에 아마도 드라이브는 쓰기에 만족했을 것입니다. 확인하려면 장시간 SMART 자체 테스트(일반적으로 표면 검사 포함)를 실행해야 하지만 드라이브가 작동하는 동안 컴퓨터를 이동하는 것과 관련된 결함일 가능성이 높습니다.

또한 중요한 것은 값이 1인 188 Command_Timeout입니다. 이는 다음과 같이 정의됩니다.

걱정할 가치가 없습니다. 드라이브는 거의 2600시간의 전원 켜짐 시간을 보고하며 해당 기간 동안 단일 명령 시간 초과가 발생했습니다. 명령 시간 초과는 실패한 명령을 다시 시도하거나 I/O 작업을 실패하여 OS에서 처리하므로 이것이 지속적인 문제인 경우 이에 대해 알 수 있습니다. 8개의 보류 중인 섹터와 관련이 있을 수도 있고 관련이 없을 수도 있습니다.

이것이 눈에 띄게 증가하기 시작하면 걱정되지만 시스템 작동에 문제가 있다는 다른 징후가 없는 한 자리 숫자의 시간 초과는 걱정하지 않습니다.

나는 낮은 수준의 프로그래밍을 해왔고 약 50번 정도 컴퓨터를 강제 종료해야 했습니다.

이는 논리적 데이터 일관성(파일 시스템 손상 등)에 영향을 미칠 수 있지만 걱정할 만한 수준의 물리적 드라이브에는 영향을 미치지 않습니다.

또한,톱밥님의 댓글:

단기 및 확장 자가 테스트를 실행해야 합니다. ID#187 Reported_Uncorcor 오류가 많이 발생하면 문제가 있음을 나타냅니다. 약 40POHours 전에 수정 불가능한 읽기 오류가 대량 발생한 것 같습니다.

이는 좋은 지적이지만,우리는 원시 값의 인코딩을 모릅니다.우리가 알 수 있는 것은 "값"이 현재 정규화된 100이며, 최악의 값은 1이고 임계값(드라이브에 오류가 발생했거나 오류가 임박했음을 보고하기 위한)은 0이라는 것입니다. 즉,현재드라이브는 이 값이 우려할 만한 원인이라고 생각하지 않습니다. 그리고 1.45e14 읽기 오류는 거의 불가능할 정도로 높게 들립니다. 자체 인정에 따르면 드라이브에는 약 183,000개의 섹터(4KiB/섹터에서 750GB)가 있습니다. 원시 값으로 보고된 읽기 실패 수를 얻으려면 각각의 모든 단일 섹터가 보고된 2,586 전원 켜기 시간 동안 791,000회 실패하거나 전체 읽기 실패 1회를 수행해야 합니다.전체11초마다 표면에 나타납니다. 이것은 정말 터무니없는 숫자입니다(10초 안에읽다전체 디스크 표면의 작은 부분에 불과하므로 이 드라이브와 속성 187에 대해 높은 수준의 확실성을 가지고 안전하게 결론을 내릴 수 있습니다.원시 값은뭔가 다른 것단순한 정수 개수보다.원시 값은 실제 값을 인코딩하는 상위 또는 하위 비트와 다른 값을 인코딩하는 다른 비트로 두 부분으로 분할될 수 있습니다. 해당 속성의 원시 값에 대한 16진수 값은 83D0 0005 01C8입니다. 여기서 가운데의 0 문자열은 이러한 인코딩을 나타냅니다. 확실히 가능하기는 하지만 무작위 오류 수의 중간에 이렇게 긴 0 문자열이 있을 가능성은 거의 없습니다. 예를 들어 하위 비트(501C8 16진수)를 사용하면 328,136개의 보고된 오류가 발생하지만 여전히 상당히 많은 오류가 발생합니다.많은더 믿을만합니다.

결론,SMART는 훌륭한 모니터링 도구일 수 있지만 모든 문제를 포착하고 보고하도록 설계되지는 않았습니다. 일부 드라이브는 SMART가 완전히 종료되어야 한다고 표시한 후에도 오랫동안 행복하게 작동하며 일부 드라이브는 실패 후에도 모든 것이 훌륭하다고 SMART가 말했음에도 불구하고 치명적인 오류를 발생시킵니다. SMART 데이터를 조기 경보 시스템 및 상태 보고로 활용하세요.~ 아니다드라이브의 상태에 대한 일종의 절대적인 진실입니다. 또한 인코딩이 구현에 따라 정의되므로 비판적인 시각으로 원시 값을 읽어야 합니다.꽤,보고된 "값"이 드라이브의 "임계값" 값과 어떻게 비교되는지 살펴봐야 합니다. 이 값은 제조업체가 특정 드라이브에 대해 의미 있게 정의한 것으로 간주되기 때문입니다.

이전에 보류 중인(기본적으로 "읽기 어렵다"는 의미) 섹터가 걱정된다면,SMART를 통해 전체 표면 스캔을 실행합니다."보류 중" 상태로 돌아오면 드라이브 교체 여부를 고려해 볼 가치가 있지만, 간단한 사실은 거의 모든 드라이브에서 문제가 발생한다는 것입니다.일부불량 섹터는 유효 수명 동안 제거되며 불량 섹터를 재할당하여 이를 보상할 수 있는 예비 섹터가 많이 있습니다. 재할당에는 데이터가 알려져 있어야 하므로 섹터에 문제가 발생하면 해당 섹터에 쓰는 동안에만 재할당될 수 있습니다.

Answer 1

197 Current_Pending_Sector 값은 8이었지만 드라이브를 0으로 만든 후에는 값이 0으로 되돌아가고 196 Real located_Event_Count는 0입니다.

이는 어느 시점에서 드라이브가 일부 섹터를 읽는 데 문제가 있었지만 드라이브를 0으로 만든 이후로는 아무런 문제도 발생하지 않았음을 의미합니다. 전체 드라이브를 새로운 데이터로 덮어쓰면 섹터가 재할당 보류 상태에서 정상 상태로 바뀌었고, 그 시점에서 섹터가 재할당되지 않았기 때문에 아마도 드라이브는 쓰기에 만족했을 것입니다. 확인하려면 장시간 SMART 자체 테스트(일반적으로 표면 검사 포함)를 실행해야 하지만 드라이브가 작동하는 동안 컴퓨터를 이동하는 것과 관련된 결함일 가능성이 높습니다.

또한 중요한 것은 값이 1인 188 Command_Timeout입니다. 이는 다음과 같이 정의됩니다.

걱정할 가치가 없습니다. 드라이브는 거의 2600시간의 전원 켜짐 시간을 보고하며 해당 기간 동안 단일 명령 시간 초과가 발생했습니다. 명령 시간 초과는 실패한 명령을 다시 시도하거나 I/O 작업을 실패하여 OS에서 처리하므로 이것이 지속적인 문제인 경우 이에 대해 알 수 있습니다. 8개의 보류 중인 섹터와 관련이 있을 수도 있고 관련이 없을 수도 있습니다.

이것이 눈에 띄게 증가하기 시작하면 걱정되지만 시스템 작동에 문제가 있다는 다른 징후가 없는 한 자리 숫자의 시간 초과는 걱정하지 않습니다.

나는 낮은 수준의 프로그래밍을 해왔고 약 50번 정도 컴퓨터를 강제 종료해야 했습니다.

이는 논리적 데이터 일관성(파일 시스템 손상 등)에 영향을 미칠 수 있지만 걱정할 만한 수준의 물리적 드라이브에는 영향을 미치지 않습니다.

또한,톱밥님의 댓글:

단기 및 확장 자가 테스트를 실행해야 합니다. ID#187 Reported_Uncorcor 오류가 많이 발생하면 문제가 있음을 나타냅니다. 약 40POHours 전에 수정 불가능한 읽기 오류가 대량 발생한 것 같습니다.

이는 좋은 지적이지만,우리는 원시 값의 인코딩을 모릅니다.우리가 알 수 있는 것은 "값"이 현재 정규화된 100이며, 최악의 값은 1이고 임계값(드라이브에 오류가 발생했거나 오류가 임박했음을 보고하기 위한)은 0이라는 것입니다. 즉,현재드라이브는 이 값이 우려할 만한 원인이라고 생각하지 않습니다. 그리고 1.45e14 읽기 오류는 거의 불가능할 정도로 높게 들립니다. 자체 인정에 따르면 드라이브에는 약 183,000개의 섹터(4KiB/섹터에서 750GB)가 있습니다. 원시 값으로 보고된 읽기 실패 수를 얻으려면 각각의 모든 단일 섹터가 보고된 2,586 전원 켜기 시간 동안 791,000회 실패하거나 전체 읽기 실패 1회를 수행해야 합니다.전체11초마다 표면에 나타납니다. 이것은 정말 터무니없는 숫자입니다(10초 안에읽다전체 디스크 표면의 작은 부분에 불과하므로 이 드라이브와 속성 187에 대해 높은 수준의 확실성을 가지고 안전하게 결론을 내릴 수 있습니다.원시 값은뭔가 다른 것단순한 정수 개수보다.원시 값은 실제 값을 인코딩하는 상위 또는 하위 비트와 다른 값을 인코딩하는 다른 비트로 두 부분으로 분할될 수 있습니다. 해당 속성의 원시 값에 대한 16진수 값은 83D0 0005 01C8입니다. 여기서 가운데의 0 문자열은 이러한 인코딩을 나타냅니다. 확실히 가능하기는 하지만 무작위 오류 수의 중간에 이렇게 긴 0 문자열이 있을 가능성은 거의 없습니다. 예를 들어 하위 비트(501C8 16진수)를 사용하면 328,136개의 보고된 오류가 발생하지만 여전히 상당히 많은 오류가 발생합니다.많은더 믿을만합니다.

결론,SMART는 훌륭한 모니터링 도구일 수 있지만 모든 문제를 포착하고 보고하도록 설계되지는 않았습니다. 일부 드라이브는 SMART가 완전히 종료되어야 한다고 표시한 후에도 오랫동안 행복하게 작동하며 일부 드라이브는 실패 후에도 모든 것이 훌륭하다고 SMART가 말했음에도 불구하고 치명적인 오류를 발생시킵니다. SMART 데이터를 조기 경보 시스템 및 상태 보고로 활용하세요.~ 아니다드라이브의 상태에 대한 일종의 절대적인 진실입니다. 또한 인코딩이 구현에 따라 정의되므로 비판적인 시각으로 원시 값을 읽어야 합니다.꽤,보고된 "값"이 드라이브의 "임계값" 값과 어떻게 비교되는지 살펴봐야 합니다. 이 값은 제조업체가 특정 드라이브에 대해 의미 있게 정의한 것으로 간주되기 때문입니다.

이전에 보류 중인(기본적으로 "읽기 어렵다"는 의미) 섹터가 걱정된다면,SMART를 통해 전체 표면 스캔을 실행합니다."보류 중" 상태로 돌아오면 드라이브 교체 여부를 고려해 볼 가치가 있지만, 간단한 사실은 거의 모든 드라이브에서 문제가 발생한다는 것입니다.일부불량 섹터는 유효 수명 동안 제거되며 불량 섹터를 재할당하여 이를 보상할 수 있는 예비 섹터가 많이 있습니다. 재할당에는 데이터가 알려져 있어야 하므로 섹터에 문제가 발생하면 해당 섹터에 쓰는 동안에만 재할당될 수 있습니다.

SMART 속성을 통해 드라이브의 신뢰성 진단

답변1

관련 정보