
¿Cuál es la vida media de un disco duro SATA?
Casi todos los datos que puedo encontrar dan tasas de falla durante los primeros 0 a 5 años, pero ninguno parece encontrar el final de la vida útil de las unidades.
Los informes, gráficos y estudios de Google, Backblaze y similares solo cuentan una parte de la historia, ya que se centran en los primeros 5 años +/-.
Hipotéticamente, decir que el 50% de las unidades muere en 8 años no implica que el otro 50% muera en 16 años. ¿Existe un gráfico que lleve el 100% de un conjunto de unidades a su muerte y proporcione los resultados? ¿O algo que proporcione información equivalente?
Suponiendo que el consumidor tenga una gran carga de trabajo en sus unidades de disco en un típico hogar/oficina con clima controlado,¿Cuál es el promedio mundial real de vida útil de los discos duros? Nuevamente, no se trata de tasas de falla dada una vida útil (corta).
Los resultados reales para nosotros son que hemos tenido menos del 10% de fallas en las unidades en 10 años y nunca fallas muy juntas, por lo que me siento bastante cómodo usando unidades antiguas, pero me gusta estar informado siempre que sea posible; Nuestro conjunto actual de unidades oscila entre 0 y 8 años (en funcionamiento), con un promedio probablemente de entre 3 y 4 años; la falla más reciente fue una unidad de 5 años en funcionamiento. Además, tenemos unidades de 40 GB y 80 GB, cada una de las cuales tiene más de 10 años (fecha de fabricación) y todavía se usan de manera confiable aquí y allá. Hay suficientes datos para decir que los discos duros SATA duran de manera confiable mucho más de 5 años, pero no suficientes para mostrar una tendencia de cuánto tiempo.
Antecedentes:
Estamos pasando a una configuración OBR10 para una pequeña empresa con unidades SATA antiguas de 4 a 6 años y estoy tratando de descubrir qué tan prudente sería pasar a una copia MD RAID 10 versus 2 de 3 copias.
Con duplicaciones de datos diarias y copias de seguridad completas, no sería perjudicial tener una pérdida completa del conjunto primario y tener que reconstruir y restaurar desde la copia de seguridad, pero me encantaría evitar ese escenario. Sin embargoParece que no puedo encontrar datos que superen la antigüedad de nuestras unidades actuales..y no hay indicios de que fracasen en masa en la marca de 5 +/- años donde los datos parecen detenerse.
Respuesta1
TLDR: Es imposible poner un número a la vida útil promedio del disco duro, porque es demasiado complejo.
No existe una medida real de la vida promedio, ya que depende profundamente de una gran cantidad de factores diferentes. es un poco como preguntarQue tan larga es una pieza de cordon. Para una unidad específica, una hoja de datos puede tener información relevante, aunque sigue siendo unabrutoindican, que quizás haya que interpretar con una pizca de sal y hojas de té.
Para empezar, una falla en una sola unidad cuando tiene una unidad es untragediatener una unidad de una matriz atacada que es parte de un grupo de matrices es una estadística. Uno no puede mirar una unidad específica y decir "esto ciertamente durará una década". Se puede decir "Este disco debería durar 5 años" y planificar su sustitución de forma planificada.
También me gustaría señalar que backblaze y google, y la mayor parte de la industria, están preocupados porpromediotasas de fracaso yfiabilidaddurante la vida útil de una unidadbajo condiciones específicas. Quieren comprar un montón de unidades, utilizarlas de la manera más económica y eficiente posible y no preocuparse realmente por ellas hasta que planifiquen el reemplazo. Es incluso mejor saber que "estas son las señales de que un disco va a morir" que dejar que mueran y poder equilibrar los costos de enfriar un lugar con los costos de hardware de los discos duros tostados.
En la práctica, los discos duros son dispositivos básicos y, por lo general, en la mayoría de los lugares no se realiza un seguimiento de la confiabilidad. Sólo recientemente (¡relativamente!) las grandes empresas comenzaron a implementar flotas gigantes de estas unidades y comenzaron a compartir su información de confiabilidad.
Hay una buena razón por la que nos centramos enanálisis predictivo de fallasy recogiendomodelos de confiabilidadencimaconfiabilidad a largo plazo. Simplemente, todo el hardware muere y es "más barato" en términos de mano de obra, tiempo de inactividad e incluso, en algunos casos, contabilidad para reemplazar las unidades.antestienden a morir por fallas mecánicas.
EspecíficoLas unidades pueden tener problemas: el Seagate 7200.11 era conocido por morir aleatoriamente debido a un firmware defectuoso, por ejemplo, y se solucionó más tarde. Otras marcas y modelos de unidades pueden tener niveles ridículos de confiabilidad. Literalmente, nunca me ha fallado una unidad de escritorio HGST.
Podrías buscar el tiempo medio hasta el fallo para elmodelo- lo que debería correlacionarse con la vida media del disco, pero la literatura moderna parece considerarlo un montón de hockey sobre caballos. Seagate ha cambiado aAFRde todos modos.
Mientras buscaba esto, me encontréesteexcelenteconjunto de diapositivaspor alguien de WD. No estoy seguro de si la conferencia asociada está en algún lugar en línea.
Hay una excelente indicación de cuál es la confiabilidad/vida útil mínima que espera un importante fabricante de discos duros.
Evite una catástrofe inmanejable a mitad (o más allá) de la vida útil de la garantía de un producto.
La garantía típica para un dispositivo empresarial, ymás viejodiscos duros de consumo es de 5 años. Son 3 años para las unidades más nuevas. Por lo tanto, el fabricante de su disco duro asume que sus unidades no fallarán antes de 5 años porque les costará dinero. Como tal, asumen que usted asumirá el riesgo o lo reemplazará después de ese tiempo.
El resto de la presentación es una buena lectura, pero se salta la mayor parte de la física.
Este es un pequeño gráfico simple que muestra todos los elementos involucrados en la confiabilidad del disco duro, tomado del mismo conjunto de diapositivas.
Y aunque la gente habla de la clásica curva de bañera cuando se trata de confiabilidad de manejo, cosas como laactualciclo de trabajo, cuando se escriben en una unidad y la temperatura importa,ademása todos estos factores ambientales y de diseño. Es demasiado complejo para adivinarlo.