我最近(大約一週前)購買了一塊硬碟(希捷 ST3000VN007),並設定了 SMART 監控。我還使用了壞塊來查看是否因運輸方式而造成任何重要損壞。
今天,我看到 High Fly 寫入數量高得可疑(原始值 39)。我知道這是一個“資訊性”參數,但我覺得對於新磁碟來說它有點太高了。
我是否應該擔心並退回驅動器,或者看到這麼高的數字是否正常(為什麼?)?
這是完整的 SMART 數據:
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 115 100 006 Pre-fail Always - 99844816
3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 5
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 317858
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 92
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 5
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 061 061 000 Old_age Always - 39
190 Airflow_Temperature_Cel 0x0022 067 064 045 Old_age Always - 33 (Min/Max 29/36)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 2
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 5
194 Temperature_Celsius 0x0022 033 040 000 Old_age Always - 33 (0 22 0 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
答案1
我看到高飛寫入數高得可疑
建議定期備份,並密切注意其他參數和整體磁碟機運作狀況。
也值得經常檢查該值,正如 Back blaze 所說,「許多出現此錯誤的故障驅動器都有相似數量的錯誤,但它們分佈在更短的時間內,例如一周內有 52 個錯誤突然間,SMART 189透過在一小段時間內尋找High Fly Write 集群來預測失敗,看起來非常有趣。
High Fly Writes SMART 參數指示在驅動器生命週期內偵測到的這些錯誤的計數。 HDD 生產商實施了飛行高度監視器,該監視器試圖透過偵測記錄磁頭何時飛出其正常工作範圍來為寫入作業提供額外的保護。如果遇到不安全的飛行高度條件,則寫入過程將停止,並且資訊將被重寫或重新分配到硬碟的安全區域。建議
大多數硬體供應商認為此參數是參考性的。儘管此參數的退化可能表示驅動器老化和/或潛在的機電問題,但它並未直接指示即將發生的驅動器故障。建議定期備份。密切注意其他參數和整體驅動器運行狀況。
另一個需要考慮的統計數據:SMART 189 – High Fly Writes
我們一直在審查這項統計數據,看看它是否會加入我們今天使用的五項 SMART 統計數據的當前清單。此統計數據是記錄頭「飛」出其正常工作範圍的次數的累積計數。下面我們列出了 SMART 189 原始值大於零的運行驅動器和故障驅動器的百分比。
Failed Drives: 47.0% Operational Drives: 16.4%
具有大於零值的運行驅動器的誤報百分比乍一看似乎使該統計數據毫無意義。但是,如果我告訴您,對於大多數存在 SMART 189 錯誤的運行驅動器,這些錯誤在很長一段時間內相當均勻地分佈。例如,52 週內平均每週出現一個錯誤。另外,如果我告訴你呢?許多出現此錯誤的故障磁碟機都有相似數量的錯誤,但它們分佈在更短的時間內,例如一周內有 52 個錯誤。突然間,SMART 189 在透過在一小段時間內尋找 High Fly Write 叢集來預測故障方面看起來非常有趣。我們目前正在研究 SMART 189 的使用,以確定我們是否可以定義錯誤發生率的有用範圍。