我的硬碟故障了嗎?

我的硬碟故障了嗎?

我只是嘗試在我的硬碟上運行測試,但它不想完成自我檢測。結果如下:

smartctl --attributes --log=selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build)

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       697
  3 Spin_Up_Time            0x0027   206   160   021    Pre-fail  Always       -       691
  4 Start_Stop_Count        0x0032   074   074   000    Old_age   Always       -       26734
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       28
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7432
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3186
191 G-Sense_Error_Rate      0x0032   001   001   000    Old_age   Always       -       20473
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       84
193 Load_Cycle_Count        0x0032   051   051   000    Old_age   Always       -       447630
194 Temperature_Celsius     0x0022   113   099   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       16
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%      7432         92290592
# 2  Conveyance offline  Completed: read failure       90%      7432         92290596
# 3  Conveyance offline  Completed: read failure       90%      7432         92290592
# 4  Short offline       Completed: read failure       90%      7431         92290596
# 5  Extended offline    Completed: read failure       90%      7431         92290592

那麼這個磁碟是否有故障呢?

答案1

您的驅動器很樂意做一次自檢;從總結來看,在過去的一個小時裡,它已經完成了五次以上。在測試初期,所有這些都因讀取錯誤而失敗。

是的,這個硬碟出現故障。正如著名的Google實驗室報告所說(儘管我目前無法提供該報告的連結),如果smartctl說您的驅動器出現故障,那麼它很可能是(我解釋一下)。

編輯: 不要試圖保存它。取出所有數據並替換它。

答案2

為了回答您的問題,失敗的 SMART 測試肯定表明驅動器即將發生故障。您應該備份資料並儘快更換驅動器,以防止潛在的資料遺失。

@sj0h 提到了加載週期計數,該計數非常高,為 447,630。 (大多數現代硬碟的設計能夠承受600,000 次加載/卸載循環。)這通常是由高級電源管理(APM) 功能引起的,該功能試圖透過在幾秒鐘後停止磁頭(將它們從碟片上卸載)來節省電量。當需要時,磁頭被裝回到碟片上。在大多數系統上,硬碟會出現間歇性的開關活動,這可能會導致發生大量加載/卸載週期。若要關閉 APM,請在 root 提示字元下執行下列命令:

smartctl -s apm,off /dev/sda

每次系統重新啟動或進入睡眠狀態或驅動器關閉時都需要執行此命令,因為驅動器關閉時不會保留此設定。

根據我的經驗,這樣做將大大減少加載/卸載週期的次數,從而減少您將來再次遇到此類故障的機會。但請注意,這樣做會增加功耗和驅動器溫度。如果驅動器持續在超過 50 °C 的溫度下運行,則過早故障的風險會增加,因此您可能需要在溫暖的月份將 APM 保持開啟(如果已關閉,則將其開啟)。

答案3

除了讀取失敗之外,還要考慮載入週期計數。在接近 500,000 時,這可能表示故障的原因,或至少是高負載循環磨損。每分鐘通電時間都有一個負載週期。更換驅動器後,請確保新驅動器也不會發生這種情況。

答案4

我會親自更換驅動器。如果您由於某種原因還不想這樣做,但仍要繼續使用磁碟機一段時間,則需要某種方法來確保您不會意外地將壞區用於新檔案。

我在一台舊 Mac 上有一個這樣的驅動器,只是用來錄製視頻,但我決定暫時不想更改它,因為擁有這些視頻真是太好了。所以我需要隔離錯誤。首先,我僅為壞文件創建了一個空文件夾,然後我嘗試讀取磁碟上的所有現有文件,並將任何有錯誤的文件移至壞文件目錄(希望只是不重要)。

然後,我創建了許多唯一命名的 1 MB 檔案來填充硬碟(因此所有空白空間現在都在這些 1 MB 檔案之一中),然後重複該過程。所有有錯誤的檔案都被移動到壞檔案目錄,剩下的檔案是好的,可以刪除以回收壞空間。

現在您可以使用該驅動器一段時間,但不要將其用於重要的事情。它將要失敗的次數越多,發生時很可能會造成不便。

相關內容