
我只是嘗試在我的硬碟上運行測試,但它不想完成自我檢測。結果如下:
smartctl --attributes --log=selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build)
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 697
3 Spin_Up_Time 0x0027 206 160 021 Pre-fail Always - 691
4 Start_Stop_Count 0x0032 074 074 000 Old_age Always - 26734
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 28
9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 7432
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 097 097 000 Old_age Always - 3186
191 G-Sense_Error_Rate 0x0032 001 001 000 Old_age Always - 20473
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 84
193 Load_Cycle_Count 0x0032 051 051 000 Old_age Always - 447630
194 Temperature_Celsius 0x0022 113 099 000 Old_age Always - 34
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 16
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline - 0
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: read failure 90% 7432 92290592
# 2 Conveyance offline Completed: read failure 90% 7432 92290596
# 3 Conveyance offline Completed: read failure 90% 7432 92290592
# 4 Short offline Completed: read failure 90% 7431 92290596
# 5 Extended offline Completed: read failure 90% 7431 92290592
那麼這個磁碟是否有故障呢?
答案1
您的驅動器很樂意做一次自檢;從總結來看,在過去的一個小時裡,它已經完成了五次以上。在測試初期,所有這些都因讀取錯誤而失敗。
是的,這個硬碟出現故障。正如著名的Google實驗室報告所說(儘管我目前無法提供該報告的連結),如果smartctl
說您的驅動器出現故障,那麼它很可能是(我解釋一下)。
編輯: 不要試圖保存它。取出所有數據並替換它。
答案2
為了回答您的問題,失敗的 SMART 測試肯定表明驅動器即將發生故障。您應該備份資料並儘快更換驅動器,以防止潛在的資料遺失。
@sj0h 提到了加載週期計數,該計數非常高,為 447,630。 (大多數現代硬碟的設計能夠承受600,000 次加載/卸載循環。)這通常是由高級電源管理(APM) 功能引起的,該功能試圖透過在幾秒鐘後停止磁頭(將它們從碟片上卸載)來節省電量。當需要時,磁頭被裝回到碟片上。在大多數系統上,硬碟會出現間歇性的開關活動,這可能會導致發生大量加載/卸載週期。若要關閉 APM,請在 root 提示字元下執行下列命令:
smartctl -s apm,off /dev/sda
每次系統重新啟動或進入睡眠狀態或驅動器關閉時都需要執行此命令,因為驅動器關閉時不會保留此設定。
根據我的經驗,這樣做將大大減少加載/卸載週期的次數,從而減少您將來再次遇到此類故障的機會。但請注意,這樣做會增加功耗和驅動器溫度。如果驅動器持續在超過 50 °C 的溫度下運行,則過早故障的風險會增加,因此您可能需要在溫暖的月份將 APM 保持開啟(如果已關閉,則將其開啟)。
答案3
除了讀取失敗之外,還要考慮載入週期計數。在接近 500,000 時,這可能表示故障的原因,或至少是高負載循環磨損。每分鐘通電時間都有一個負載週期。更換驅動器後,請確保新驅動器也不會發生這種情況。
答案4
我會親自更換驅動器。如果您由於某種原因還不想這樣做,但仍要繼續使用磁碟機一段時間,則需要某種方法來確保您不會意外地將壞區用於新檔案。
我在一台舊 Mac 上有一個這樣的驅動器,只是用來錄製視頻,但我決定暫時不想更改它,因為擁有這些視頻真是太好了。所以我需要隔離錯誤。首先,我僅為壞文件創建了一個空文件夾,然後我嘗試讀取磁碟上的所有現有文件,並將任何有錯誤的文件移至壞文件目錄(希望只是不重要)。
然後,我創建了許多唯一命名的 1 MB 檔案來填充硬碟(因此所有空白空間現在都在這些 1 MB 檔案之一中),然後重複該過程。所有有錯誤的檔案都被移動到壞檔案目錄,剩下的檔案是好的,可以刪除以回收壞空間。
現在您可以使用該驅動器一段時間,但不要將其用於重要的事情。它將要失敗的次數越多,發生時很可能會造成不便。