
SATA 硬碟的平均壽命是多少?
我能找到的幾乎所有數據都給出了前 0-5 年的故障率,但似乎沒有一個數據能夠真正找到驅動器的使用壽命終點。
Google、backblaze 等的報告、圖表和研究僅講述了故事的一部分,因為它們關注的是前 5 年 +/-。
假設 50% 的驅動器會在 8 年內失效,並不能推斷其他 50% 的驅動器會在 16 年內失效。 是否有一個圖表可以將一組驅動器 100% 驅動到死亡並給出結果?或是可以提供同等資訊的東西?
假設在典型的氣候控製家庭/辦公室中消費者驅動器上有繁重的消費者工作負載,硬碟機的實際平均壽命是多少? 再次強調,不是給定(短)設定壽命的故障率。
對我們來說,現實世界的結果是,我們在10 年內發生的驅動器故障率低於10%,並且從未發生過類似的故障,因此我對使用老化的驅動器非常滿意,但希望盡可能得到通知;我們目前的驅動器組的使用壽命為 0-8(運行)年,平均約為 3-4 年,最近一次故障是運行了 5 年的驅動器。此外,我們還有 40GB 和 80GB 驅動器,每個驅動器都有 10 多年(製造日期)的歷史,並且仍然可以可靠地使用。有足夠的數據表明 SATA HDD 的可靠使用壽命遠遠超過 5 年,但不足以顯示持續時間的趨勢。
背景:
我們正在為一家擁有 4-6 年舊 SATA 驅動器的小型企業遷移到 OBR10 設置,我試圖弄清楚遷移到 3 副本 MD RAID 10 與 2 副本相比是否謹慎。
透過每日資料鏡像和完整備份,完整的主陣列遺失並需要從備份重建和復原不會有什麼壞處,但我希望避免這種情況。然而我似乎找不到看起來遠遠超出我們當前驅動器年齡的數據。並且沒有跡象表明他們在 5 +/- 年標記處大量失敗,而數據似乎已停止。
答案1
TLDR:不可能給出硬碟平均壽命的數字,因為它太複雜了。
平均壽命沒有真正的衡量標準,因為它很大程度上取決於一系列不同的因素。這有點像問一段繩子有多長。對於特定的驅動器,數據表可能有一些相關信息,儘管它仍然是一個粗糙的表明,這可能需要用少許鹽和茶葉來解釋。
首先,當您有一個驅動器時,單一驅動器故障會導致悲劇被襲擊的陣列中的一個驅動器屬於陣列集群的一部分是一項統計數據。人們可以說“這個驅動器應該可以使用 5 年”,並計劃有計劃地更換它。
我還要注意到 backblaze 和 google,以及大多數行業都關心平均的故障率和可靠性在驅動器的使用壽命內在特定條件下。他們希望購買一卡車的驅動器,盡可能便宜且有效率地運行它們,並且在計劃更換之前不會真正擔心它們。知道「這些是驅動器即將死亡的跡象」比讓它們死亡更好,並且能夠平衡冷卻地方的成本與烤硬碟油炸的硬體成本。
實際上,硬碟是商品設備 - 通常大多數地方實際上並不追蹤可靠性。直到最近(相對而言!),大公司才開始部署大量這些驅動器並開始共享其可靠性資訊。
重點關注是有充分理由的預測失效分析和採摘可靠度模型超過長期可靠性。簡單地說,所有硬體都會失效,並且在人力、停機時間甚至在某些情況下更換驅動器的成本方面“更便宜”前他們往往會死於機械故障。
具體的硬碟可能有問題 - 例如,希捷 7200.11 因韌體損壞而隨機死機,後來得到修復。其他品牌和型號的驅動器可能具有令人難以置信的可靠性水平。我從來沒有遇到過 HGST 桌上型電腦驅動器故障的情況。
您可以找到平均無故障時間模型- 這應該與驅動器的平均壽命相關,但現代文獻似乎認為它是馬曲棍球的負荷。希捷已切換至AFFR反正。
在查找此內容時 - 我遇到了這偉大的投影片集由 WD 的某人提供。不確定相關講座是否在網路上。
有一個很好的跡象表明主要硬碟製造商期望的最低可靠性/使用壽命是多少。
避免產品保固期中途(或之後)發生無法控制的災難
企業設備的典型保修,以及較老的消費性硬碟的保存期限是5年。新驅動器的使用期限為 3 年。因此,您的硬碟製造商假設他們的驅動器在 5 年內不會出現故障,因為這會讓他們損失金錢。因此,他們認為您要么承擔風險,要么在時間結束後更換它。
簡報的其餘部分值得一讀,但跳過了大部分物理知識。
這是一個簡單的小圖,顯示了與硬碟可靠性相關的所有元素,取自同一組幻燈片
雖然人們談論的驅動可靠性是經典的浴盆曲線,但諸如實際的佔空比,當寫入發生在驅動器上且溫度很重要時,另外所有這些設計和環境因素。它太複雜了,難以猜測。