내 하드 드라이브에 문제가 있습니까?

내 하드 드라이브에 문제가 있습니까?

방금 HDD에서 테스트를 실행하려고 했는데 자체 테스트를 완료하고 싶지 않습니다. 결과는 다음과 같습니다.

smartctl --attributes --log=selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build)

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       697
  3 Spin_Up_Time            0x0027   206   160   021    Pre-fail  Always       -       691
  4 Start_Stop_Count        0x0032   074   074   000    Old_age   Always       -       26734
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       28
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7432
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3186
191 G-Sense_Error_Rate      0x0032   001   001   000    Old_age   Always       -       20473
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       84
193 Load_Cycle_Count        0x0032   051   051   000    Old_age   Always       -       447630
194 Temperature_Celsius     0x0022   113   099   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       16
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%      7432         92290592
# 2  Conveyance offline  Completed: read failure       90%      7432         92290596
# 3  Conveyance offline  Completed: read failure       90%      7432         92290592
# 4  Short offline       Completed: read failure       90%      7431         92290596
# 5  Extended offline    Completed: read failure       90%      7431         92290592

그럼 이 디스크에 문제가 있는 걸까요?

답변1

귀하의 드라이브는 자체 테스트를 수행하게 되어 매우 기쁩니다. 요약에 따르면 지난 한 시간 동안 5개 이상의 작업을 수행했습니다. 그리고 테스트 초기에 읽기 오류로 인해 모두 실패했습니다.

예, 이 하드 드라이브에 오류가 발생했습니다. 유명한 Google Labs 보고서에서 말했듯이(지금은 링크를 확인할 수 없지만) smartctl드라이브에 오류가 발생했다고 말하면 아마도 그럴 것입니다(다른 말로 바꿔서 설명합니다).

편집하다: 저장하려고 하지 마세요. 모든 데이터를 꺼내서 교체하세요.

답변2

귀하의 질문에 대답하자면, 실패한 SMART 테스트는 임박한 드라이브 오류를 나타내는 확실한 표시입니다. 잠재적인 데이터 손실을 방지하려면 가능한 한 빨리 데이터를 백업하고 드라이브를 교체해야 합니다.

@sj0h는 로드 사이클 수가 447,630으로 매우 높다고 언급했습니다. (대부분의 최신 하드 드라이브는 600,000번의 로드/언로드 주기를 견딜 수 있도록 설계되었습니다.) 이는 일반적으로 몇 초 후에 헤드를 플래터에서 언로드하여 전원을 절약하려고 하는 고급 전원 관리(APM) 기능으로 인해 발생합니다. 게으른. 필요할 때 헤드는 플래터에 다시 로드됩니다. 하드 드라이브가 간헐적으로 켜지고 꺼지는 활동을 하는 대부분의 시스템에서 이로 인해 많은 로드/언로드 주기가 발생할 수 있습니다. APM을 끄려면 루트 프롬프트에서 다음 명령을 실행하십시오.

smartctl -s apm,off /dev/sda

이 명령은 시스템 전원을 껐다 켜거나 절전 모드로 전환하거나 드라이브 전원을 끌 때마다 실행해야 합니다. 드라이브가 꺼지면 이 설정이 유지되지 않기 때문입니다.

내 경험에 따르면 이렇게 하면 로드/언로드 주기 수가 크게 줄어들고 결과적으로 나중에 이런 종류의 오류가 다시 발생할 가능성이 줄어듭니다. 그러나 이렇게 하면 전력 소비와 드라이브 온도가 증가한다는 점에 유의하십시오. 드라이브가 50°C를 초과하는 온도에서 지속적으로 작동하는 경우 조기 고장의 위험이 증가하므로 따뜻한 계절에는 APM을 켜두는 것이 좋습니다(또는 꺼져 있는 경우 켜는 것이 좋습니다).

답변3

읽기 실패 외에도 로드 주기 횟수도 고려하십시오. 거의 500,000회에 이르면 이는 고장 원인 또는 적어도 높은 로드 사이클 마모를 나타낼 수 있습니다. 전원을 켤 때마다 로드 사이클이 있습니다. 드라이브를 교체한 후 새 드라이브에서도 이 작업이 수행되지 않는지 확인하십시오.

답변4

개인적으로 드라이브를 교체하겠습니다. 어떤 이유로 아직 그렇게 하고 싶지 않지만 드라이브를 한동안 사용하고 있는 경우 실수로 새 파일에 잘못된 영역을 사용하지 않도록 하는 방법이 필요합니다.

저는 오래된 Mac에 비디오를 녹화하는 데 그런 드라이브가 있었는데, 비디오가 가지고 있어서 좋았기 때문에 아직 바꾸고 싶지 않다고 결정했습니다. 그래서 오류를 격리해야 했습니다. 먼저 불량 파일 전용 빈 폴더를 만든 다음 디스크에 있는 모든 기존 파일을 읽으려고 시도했는데 오류가 있는 파일은 모두 bad-files-directory로 이동되었습니다(중요하지 않기를 바랍니다).

그런 다음 하드 드라이브를 채우기 위해 고유한 이름의 1MB 파일을 많이 만든 다음(따라서 모든 빈 공간은 이제 이 1MB 파일 중 하나에 있음) 절차를 반복했습니다. 오류가 있는 모든 파일은 bad-files-디렉토리로 이동되었으며 남은 파일은 양호하므로 삭제하여 불량 공간을 회수할 수 있습니다.

이제 드라이브를 조금 더 오래 사용할 수 있지만 중요한 용도로 사용하지 마십시오. 그것~ 할 것이다더 많이 실패하고 그런 일이 발생하면 불편할 가능성이 높습니다.

관련 정보