最近 (約 1 週間前)、ハード ドライブ (Seagate ST3000VN007) を購入し、SMART モニタリングを設定しました。また、配送方法による重大な損傷がないかどうかを確認するために、badblocks も使用しました。
今日、ハイ フライ書き込み数が疑わしいほど高い (生の値 39) ことに気付きました。これは「情報」パラメータであることは承知していますが、新しいディスクとしては少し高すぎるように感じます。
心配してドライブを返却すべきでしょうか、それともこのような高い数値が表示されるのは正常なのでしょうか (なぜでしょうか)?
完全なSMARTデータは次のとおりです。
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 115 100 006 Pre-fail Always - 99844816
3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 5
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 317858
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 92
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 5
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 061 061 000 Old_age Always - 39
190 Airflow_Temperature_Cel 0x0022 067 064 045 Old_age Always - 33 (Min/Max 29/36)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 2
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 5
194 Temperature_Celsius 0x0022 033 040 000 Old_age Always - 33 (0 22 0 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
答え1
ハイフライの書き込み数が疑わしいほど高いことがわかりました
定期的なバックアップが推奨され、他のパラメータとドライブ全体の健全性に細心の注意を払います。
Back Blaze は「このエラーが発生した故障したドライブの多くは、同様の数のエラーが発生していましたが、その発生期間ははるかに短く、たとえば 1 週間で 52 件のエラーが発生していました。突然、SMART 189 は、短期間で High Fly Writes のクラスターを探すことで故障を予測するのに非常に興味深いものになりました」と述べているため、この値を頻繁にチェックすることも価値があります。
High Fly Writes SMART パラメータは、ドライブの寿命中に検出されたこれらのエラーの数を示します。HDD メーカーは、記録ヘッドが通常の動作範囲外に浮上していることを検出することで書き込み操作に追加の保護を提供するフライ ハイト モニターを実装しています。安全でないフライ ハイト条件に遭遇すると、書き込みプロセスが停止され、情報はハード ドライブの安全な領域に書き直されるか、再割り当てされます。推奨事項
このパラメータは、ほとんどのハードウェア ベンダーによって情報として扱われます。このパラメータの劣化は、ドライブの老朽化や潜在的な電気機械的な問題を示す指標となる可能性がありますが、差し迫ったドライブ障害を直接示すものではありません。定期的なバックアップをお勧めします。他のパラメータとドライブ全体の健全性に注意してください。
ソースSMART 属性: ハイフライ ライト | ナレッジ ベース
考慮すべきもう一つの統計: SMART 189 – High Fly Writes
これは、現在使用している 5 つの SMART 統計のリストに追加されるかどうかを検討している統計です。この統計は、記録ヘッドが通常の動作範囲外に「飛んだ」回数の累計です。以下に、SMART 189 の生の値が 0 より大きい、動作可能なドライブと故障したドライブの割合を示します。
Failed Drives: 47.0% Operational Drives: 16.4%
一見すると、動作中のドライブの誤検出率がゼロより大きいため、この統計は意味をなさないように見えるかもしれません。しかし、SMART 189エラーが発生したほとんどの動作中のドライブでは、それらのエラーが長期間にわたってかなり均等に分散されていたとしたらどうでしょうか。たとえば、52週間にわたって平均して週に1つのエラーが発生していました。さらに、このエラーが発生した故障したドライブの多くは、同様の数のエラーが発生していましたが、その発生期間ははるかに短く、たとえば 1 週間で 52 件のエラーが発生していました。突然、SMART 189 は、短期間に High Fly Writes のクラスターを探すことで障害を予測する上で非常に興味深いものに思えてきました。現在、SMART 189 の使用を調査し、エラーが発生するレートの有用な範囲を定義できるかどうかを判断しています。