SATA HDD 오류

Question 1

내 경험에 따르면 귀하가 보고 있는 오류는 실제로 소프트웨어에 반영된 하드웨어 오류입니다. 'I/O 오류로 인해 페이지 쓰기 손실' 메시지는 불량 하드 드라이브에서 본 메시지이며 fsck를 시도할 때 설명하는 방식과 유사하게 작동합니다. 이는 거의 확실히 실제 하드웨어 결함입니다.

smartctl의 출력을 확인하여 문제가 될 수 있다고 말하는 내용을 확인해야 합니다.

smartctl --attributes /dev/sdb

다음과 유사한 출력이 제공됩니다.

=== 스마트 데이터 읽기 섹션 시작 ===
SMART 속성 데이터 구조 개정 번호: 16
임계값이 있는 공급업체별 SMART 속성:
ID 번호 ATTRIBUTE_NAME 플래그 값 RAW_VALUE일 때 최악의 임계값 유형이 업데이트되었습니다.
  1 Raw_Read_Error_Rate 0x000f 200 200 051 사전 실패 항상 - 0
  3 Spin_Up_Time 0x0003 212 186 021 사전 실패 항상 - 4358
  4 Start_Stop_Count 0x0032 100 100 000 Old_age 항상 - 97
  5 Reallocation_Sector_Ct 0x0033 200 200 140 사전 실패 항상 - 0
  7 Seek_Error_Rate 0x000f 200 200 051 사전 실패 항상 - 0
  9 Power_On_Hours 0x0032 066 066 000 Old_age 항상 - 25420
 10 Spin_Retry_Count 0x0013 100 253 051 사전 실패 항상 - 0
 11 Calibration_Retry_Count 0x0013 100 253 051 사전 실패 항상 - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age 항상 - 86
194 온도_섭씨 0x0022 104 001 000 Old_age 항상 - 46
196 Realowned_Event_Count 0x0032 200 200 000 Old_age 항상 - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age 항상 - 0
198 오프라인_수정 불가능 0x0010 200 200 000 Old_age 오프라인 - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age 항상 - 0
200 Multi_Zone_Error_Rate 0x0009 200 200 051 오프라인 사전 실패 - 0

출력은 난해할 수 있지만 제가 주목해야 할 출력은 Realwhich_Sector_Ct입니다. 이는 알려진 불량 섹터에 대한 HD의 내용을 알려주기 때문입니다. 'smartctl -a' 명령은 더 많은 데이터를 제공합니다. 내가 얼마 전에 가지고 있던 불량 HD에서 해당 출력의 맨 아래에는 몇 가지 항목이 있는 'SMART 오류 로그'가 있습니다.

Answer

내 경험에 따르면 귀하가 보고 있는 오류는 실제로 소프트웨어에 반영된 하드웨어 오류입니다. 'I/O 오류로 인해 페이지 쓰기 손실' 메시지는 불량 하드 드라이브에서 본 메시지이며 fsck를 시도할 때 설명하는 방식과 유사하게 작동합니다. 이는 거의 확실히 실제 하드웨어 결함입니다.

smartctl의 출력을 확인하여 문제가 될 수 있다고 말하는 내용을 확인해야 합니다.

smartctl --attributes /dev/sdb

다음과 유사한 출력이 제공됩니다.

=== 스마트 데이터 읽기 섹션 시작 ===
SMART 속성 데이터 구조 개정 번호: 16
임계값이 있는 공급업체별 SMART 속성:
ID 번호 ATTRIBUTE_NAME 플래그 값 RAW_VALUE일 때 최악의 임계값 유형이 업데이트되었습니다.
  1 Raw_Read_Error_Rate 0x000f 200 200 051 사전 실패 항상 - 0
  3 Spin_Up_Time 0x0003 212 186 021 사전 실패 항상 - 4358
  4 Start_Stop_Count 0x0032 100 100 000 Old_age 항상 - 97
  5 Reallocation_Sector_Ct 0x0033 200 200 140 사전 실패 항상 - 0
  7 Seek_Error_Rate 0x000f 200 200 051 사전 실패 항상 - 0
  9 Power_On_Hours 0x0032 066 066 000 Old_age 항상 - 25420
 10 Spin_Retry_Count 0x0013 100 253 051 사전 실패 항상 - 0
 11 Calibration_Retry_Count 0x0013 100 253 051 사전 실패 항상 - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age 항상 - 86
194 온도_섭씨 0x0022 104 001 000 Old_age 항상 - 46
196 Realowned_Event_Count 0x0032 200 200 000 Old_age 항상 - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age 항상 - 0
198 오프라인_수정 불가능 0x0010 200 200 000 Old_age 오프라인 - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age 항상 - 0
200 Multi_Zone_Error_Rate 0x0009 200 200 051 오프라인 사전 실패 - 0

출력은 난해할 수 있지만 제가 주목해야 할 출력은 Realwhich_Sector_Ct입니다. 이는 알려진 불량 섹터에 대한 HD의 내용을 알려주기 때문입니다. 'smartctl -a' 명령은 더 많은 데이터를 제공합니다. 내가 얼마 전에 가지고 있던 불량 HD에서 해당 출력의 맨 아래에는 몇 가지 항목이 있는 'SMART 오류 로그'가 있습니다.

Question 2

수정할 수 없는 읽기 오류가 발생했습니다.

Error: UNC at LBA = 0x03800922 = 58722594

이제 해당 블록에 있던 데이터가 손실됩니다.

다음을 수행해야 합니다.

우선 거울을 사용하세요. 엔터프라이즈 디스크는 실제로 미러 뒤에 있도록 설계되었으며 데이터를 얻기 위해 열심히 노력하는 것보다 읽기 오류를 반환하는 것이 좋습니다.
백업에서 손실된 데이터를 복구

RAID를 사용하지 않을 이유가 없습니다(특히 클라이언트용 웹 사이트를 호스팅하는 경우!). OS는 그다지 크지 않으므로 2디스크 시스템에서는 전용 디스크가 필요하지 않습니다.

Answer

수정할 수 없는 읽기 오류가 발생했습니다.

Error: UNC at LBA = 0x03800922 = 58722594

이제 해당 블록에 있던 데이터가 손실됩니다.

다음을 수행해야 합니다.

우선 거울을 사용하세요. 엔터프라이즈 디스크는 실제로 미러 뒤에 있도록 설계되었으며 데이터를 얻기 위해 열심히 노력하는 것보다 읽기 오류를 반환하는 것이 좋습니다.
백업에서 손실된 데이터를 복구

RAID를 사용하지 않을 이유가 없습니다(특히 클라이언트용 웹 사이트를 호스팅하는 경우!). OS는 그다지 크지 않으므로 2디스크 시스템에서는 전용 디스크가 필요하지 않습니다.

Question 3

RAID 컨트롤러를 사용하고 있습니까? 어떤 종류의 컨트롤러를 사용하고 있나요?

실망스러우면서도 깨달은 것 중 하나는 HDD 제조업체가 SATA 시장에 도입하고 있는 세분화가 증가하고 있다는 것입니다. 이제 '소규모 기업/RAID 용도' 및 '단일/데스크톱 용도'용 드라이브가 있습니다. SAS는 '하이엔드 엔터프라이즈' 시장을 노리고 있는 것 같습니다.

귀하의 모델 번호는 RAID 설정용으로 설계된 WD의 RE3 드라이브 시리즈입니다. 이는 무엇보다도 오류를 복구하려고 할 때 오랜 시간 동안 반복해서 시도하는 대신 드라이브가 더 빨리(즉, 3-4초 이내) '포기'한다는 것을 의미한다고 들었습니다. 더 빨리 포기하면 RAID 컨트롤러에 오류가 보고되므로 다른 드라이브를 사용하여 복구할 수 있습니다. 대신 드라이브가 더 오래 기다리면 RAID 컨트롤러가 응답하지 않는다는 이유로 드라이브를 어레이에서 쫓아냅니다.

실패는아직드물고 매년 한 번도 아닙니다. 아마도 설정의 또 다른 측면일까요? (한때 SATA 케이블 때문에 답답한 싸움을 한 적이 있는데, 이제는 다른 케이블에 대한 경고로 내 문 위에 장착되어 있습니다...)

Answer

RAID 컨트롤러를 사용하고 있습니까? 어떤 종류의 컨트롤러를 사용하고 있나요?

실망스러우면서도 깨달은 것 중 하나는 HDD 제조업체가 SATA 시장에 도입하고 있는 세분화가 증가하고 있다는 것입니다. 이제 '소규모 기업/RAID 용도' 및 '단일/데스크톱 용도'용 드라이브가 있습니다. SAS는 '하이엔드 엔터프라이즈' 시장을 노리고 있는 것 같습니다.

귀하의 모델 번호는 RAID 설정용으로 설계된 WD의 RE3 드라이브 시리즈입니다. 이는 무엇보다도 오류를 복구하려고 할 때 오랜 시간 동안 반복해서 시도하는 대신 드라이브가 더 빨리(즉, 3-4초 이내) '포기'한다는 것을 의미한다고 들었습니다. 더 빨리 포기하면 RAID 컨트롤러에 오류가 보고되므로 다른 드라이브를 사용하여 복구할 수 있습니다. 대신 드라이브가 더 오래 기다리면 RAID 컨트롤러가 응답하지 않는다는 이유로 드라이브를 어레이에서 쫓아냅니다.

실패는아직드물고 매년 한 번도 아닙니다. 아마도 설정의 또 다른 측면일까요? (한때 SATA 케이블 때문에 답답한 싸움을 한 적이 있는데, 이제는 다른 케이블에 대한 경고로 내 문 위에 장착되어 있습니다...)

Question 4

나는 Western Digital 드라이브에 대해 매우 나쁜 경험을 했습니다. 내 드라이브의 절반 이상이 완전한 오류 또는 불량 섹터로 인해 보증 기간에 따라 교체되어야 했습니다.

약 8년 동안 WD 드라이브만 구입한 후에는 더 이상 드라이브에 돈을 쓰고 싶지 않습니다. 어떤 WD 드라이브를 신뢰할 수 있는지 모르겠습니다. 지금까지 내 경험에 따르면 "그들 중 누구도"가 아닙니다.

원래 드라이브를 4번 교체했습니다. 드라이브 5개를 모두 동시에 구입하셨나요? 실패했을 때 각각 교체하기 위해 새로 구입하시겠습니까? 교체를 위해 보증이 적용되는 드라이브를 반환하시겠습니까? 5개의 드라이브를 언제, 어떻게 구입했으며, 어떤 모델이었나? 내 경험상 WD 드라이브 배치는 불량하고 동시에 실패하는 경우가 많습니다.

Answer

나는 Western Digital 드라이브에 대해 매우 나쁜 경험을 했습니다. 내 드라이브의 절반 이상이 완전한 오류 또는 불량 섹터로 인해 보증 기간에 따라 교체되어야 했습니다.

약 8년 동안 WD 드라이브만 구입한 후에는 더 이상 드라이브에 돈을 쓰고 싶지 않습니다. 어떤 WD 드라이브를 신뢰할 수 있는지 모르겠습니다. 지금까지 내 경험에 따르면 "그들 중 누구도"가 아닙니다.

원래 드라이브를 4번 교체했습니다. 드라이브 5개를 모두 동시에 구입하셨나요? 실패했을 때 각각 교체하기 위해 새로 구입하시겠습니까? 교체를 위해 보증이 적용되는 드라이브를 반환하시겠습니까? 5개의 드라이브를 언제, 어떻게 구입했으며, 어떤 모델이었나? 내 경험상 WD 드라이브 배치는 불량하고 동시에 실패하는 경우가 많습니다.

SATA HDD 오류

답변1

답변2

답변3

답변4

관련 정보