Vida média das unidades SATA?

Vida média das unidades SATA?

Qual é a vida média de um disco rígido SATA?

Quase todos os dados que posso encontrar fornecem taxas de falha nos primeiros 0 a 5 anos, mas nenhum parece realmente encontrar o fim da vida útil das unidades.

Os relatórios, gráficos e estudos do Google, backblaze e similares contam apenas parte da história, pois se concentram nos primeiros 5 anos +/-.

Hipoteticamente, dizer que 50% dos impulsos morrem em 8 anos não significa que os outros 50% morrem em 16 anos. Existe um gráfico que leva 100% de um conjunto de impulsos à morte e dá os resultados? Ou algo que forneceria informações equivalentes?

Assumindo uma carga de trabalho pesada do consumidor nas unidades do consumidor em uma típica casa/escritório com clima controlado,qual é a média mundial de vida útil do disco rígido? Novamente, não há taxas de falha devido a uma vida útil (curta) definida.

Os resultados reais para nós são que tivemos menos de 10% de falhas em unidades em 10 anos e nunca falhas próximas, por isso estou bastante confortável com o uso de unidades antigas, mas gosto de ser informado sempre que possível; Nosso conjunto atual de unidades varia de 0 a 8 anos (em funcionamento), com média provavelmente em torno de 3 a 4 anos. A falha mais recente foi uma unidade em funcionamento de 5 anos. Além disso, temos unidades de 40 GB e 80 GB, cada uma com mais de 10 anos (data de fabricação) e ainda são usadas de forma confiável aqui e ali. Dados suficientes para dizer que os HDDs SATA duram de forma confiável muito além de 5 anos, mas não o suficiente para mostrar uma tendência de quanto tempo.

Contexto:

Estamos mudando para uma configuração OBR10 para uma pequena empresa com unidades SATA antigas de 4 a 6 anos e estou tentando descobrir quão prudente seria mudar para uma cópia MD RAID 10 vs 2 de 3 cópias.

Com espelhos de dados diários e backups completos, não seria prejudicial ter uma perda completa do array primário e precisar reconstruir e restaurar a partir do backup, mas eu adoraria evitar tal cenário. No entantoNão consigo encontrar dados que pareçam muito além da idade de nossas unidades atuais.e não há indicações de que eles falhem em massa na marca de 5 +/- ano, onde os dados parecem parar.

Responder1

TLDR: É impossível definir um número para a vida útil média do disco rígido, porque é muito complexo.

Não existe uma medida real da vida média, pois ela depende profundamente de uma série de fatores diferentes. É um pouco como perguntarquanto tempo dura um pedaço de barbante. Para uma unidade específica, uma folha de dados pode conter algumas informações relevantes, embora ainda seja umduroindicar, que pode precisar ser interpretado com uma pitada de sal e folhas de chá.

Para começar, uma falha em uma única unidade quando você tem uma unidade é umtragédiater uma unidade de um array invadido que faz parte de um cluster de arrays é uma estatística. Não se pode olhar para uma unidade específica e dizer "isso certamente durará uma década". Pode-se dizer “Esta unidade deve durar 5 anos” e planejar substituí-la de forma planejada.

Eu também observaria que backblaze e google, e a maior parte da indústria estão preocupados commédiataxas de falha econfiabilidadedurante a vida útil de uma unidadesob condições específicas. Eles querem comprar um caminhão cheio de drives, operá-los da forma mais barata e eficiente possível e não se preocupar realmente com eles até a substituição planejada. É ainda melhor saber "estes são os sinais de que uma unidade vai morrer" do que vê-los morrer e ser capaz de equilibrar os custos de resfriamento de um local com os custos de hardware da fritura de discos rígidos quentinhos.

Na prática, os discos rígidos são dispositivos comuns - e normalmente a maioria dos lugares não monitora a confiabilidade. Foi apenas recentemente (relativamente!) que grandes empresas começaram a implantar frotas gigantescas dessas unidades e a compartilhar suas informações de confiabilidade.

Há uma boa razão para haver um foco emanálise preditiva de falhase escolhendomodelos de confiabilidadesobreconfiabilidade a longo prazo. Simplesmente todo o hardware morre e é “mais barato” em termos de mão de obra, tempo de inatividade e até mesmo, em alguns casos, contabilidade para substituição de unidadesanteseles tendem a morrer de falha mecânica.

Específicoas unidades podem ter problemas - o Seagate 7200.11 era conhecido por morrer aleatoriamente devido a um firmware ruim, por exemplo, e foi corrigido posteriormente. Outras marcas e modelos de drives podem ter níveis ridículos de confiabilidade. Literalmente, nunca tive uma falha em uma unidade de desktop HGST.

Você poderia pesquisar o tempo médio até a falha para omodelo- o que deveria estar correlacionado à vida média do drive, mas a literatura moderna parece considerá-lo um monte de hóquei a cavalo. Seagate mudou paraAFRde qualquer forma.

Enquanto procurava isso - me depareiesseótimoconjunto de slidespor alguém da WD. Não tenho certeza se a palestra associada está em algum lugar online.

Há uma excelente indicação de qual é a confiabilidade/vida útil mínima que um grande fabricante de discos rígidos espera.

Evite uma catástrofe incontrolável no meio (ou além) da vida útil da garantia de um produto

A garantia típica para um dispositivo empresarial emais velhodiscos rígidos de consumo é de 5 anos. São 3 anos para unidades mais recentes. Portanto, o fabricante do seu disco rígido presume que suas unidades não falharão antes de 5 anos, pois isso lhes custará dinheiro. Como tal, eles presumem que você assumirá o risco ou o substituirá após o prazo.

O resto da apresentação é uma boa leitura, mas pula a maior parte da física.

Este é um pequeno gráfico simples que mostra todos os elementos envolvidos na confiabilidade do disco rígido, retirado do mesmo conjunto de slides

insira a descrição da imagem aqui

E embora a curva clássica da banheira seja o que as pessoas falam sobre a confiabilidade da unidade, coisas como orealciclo de trabalho, quando as gravações acontecem em uma unidade e a temperatura é importante,além dissoa todos esses fatores de design e ambientais. É muito complexo para adivinhar.

informação relacionada