Em uma matriz de disco RAID 5, a recuperação de uma unidade aumenta a chance de falha de outra unidade?

Em uma matriz de disco RAID 5, a recuperação de uma unidade aumenta a chance de falha de outra unidade?

Se você tiver uma matriz RAID 5 básica de 3 ou mais discos rígidos e um deles falhar, isso aumenta a chance de uma das outras unidades falhar e impossibilitar a recuperação completa? Se cada uma das unidades estiver sendo lida durante o processo de recuperação, isso aumenta a probabilidade de falha, supondo que estejam ativas apenas uma pequena parte do dia?

Se isso afetar a estabilidade durante uma recuperação, posso considerar o RAID 6. Além disso, há algum benefício ou desvantagem em usar RAID 5 em vez de RAID 4? Parece mais organizado usar RAID 4 e mais espalhado usar RAID 5.

Responder1

Em primeiro lugar, se você estiver configurado para um ataque de paridade, eu recomendaria um RAID 5 com um esquema de backup automático em vez de um RAID 6. O backup pode ser feito em várias unidades (recomendado), um RAID 0 (não recomendado) ou outro RAID 5 . Isso traz um bom equilíbrio entre custo e segurança para seus dados porque também pode lidar com falhas do controlador e erros humanos.

O que você estará seguro fazendo depende do(s) tamanho(s) do seu array

Muitos no setor de TI estão abandonando o RAID 5 por dois motivos. Primeiro, o tamanho de cisalhamento de muitos arrays exige tempos de reconstrução extremamente longos, o que abre a janela para uma segunda falha. O segundo é o problema de um URE, que é um erro de leitura irrecuperável que não é conhecido até que um bloco não seja lido e então toda a matriz nessa unidade se torne ilegível. Novamente, os UREs acontecem raramente em termos de número de erros por bits lidos, mas quando você tem matrizes de tamanho TB, raramente acontece com muita frequência. Uma matriz não pode ser reconstruída a partir de uma unidade com URE. Portanto, se você tiver uma falha e um URE, terá efetivamente duas unidades com falha. O RAID 6 ajuda nisso porque você pode perder duas unidades e ainda reconstruir o array.

Mas, se você tiver um array de 100GB em um RAID 5, esses problemas diminuem bastante e um RAID 5 se torna mais viável; entretanto, se você tiver um array de 100 TB (apenas como exemplo) em um ataque 6, poderá precisar de mais redundância ou outra opção!

RAID 5 com matrizes TB é definitivamente uma aposta e eu não confiaria nele. E não faz sentido executar um RAID 6 com 4 unidades em vez de um RAID 10, a menos que você pretenda expandir seu array em breve e precise fazer isso em uma unidade por vez, pagando o custo. E não vamos esquecer que você pode executar vários arrays RAID 1, isso apenas separa seus dados em partições/discos separados com os quais você precisa trabalhar e elimina a conveniência de uma grande unidade.

Mas tudo tem sua ressalva. Quanto maior o RAID 5, maior a chance (exponencialmente maior) de uma falha de reconstrução devido a uma segunda unidade ou URE com falha. RAID 6 com maior custo e complexidade. Custo do RAID 10 ainda mais alto (mas para simplificar). E vários custos de conveniência do RAID 1.

No final, você precisa identificar suas necessidades, separar o que não pode perder e o que está bem em perder. Combine isso com um orçamento e seu nível de conhecimento ao escolher qual matriz escolher.

Nós, colocamos nossos dados de escritório e residências em um RAID 1 (na verdade, 2 unidades RAID 10 com MD RAID) para segurança com backups diários. é simples, rápido e confiável. Quaisquer outros dados, como arquivos de vídeo ou outros arquivos grandes e não críticos, colocamos em um RAID 5 ou em unidades únicas com backups ocasionais com base na importância dos dados, porque não queremos oferecer o mesmo nível de segurança com nossos filmes como fazemos com nossos fotos de família e/ou arquivos de nossas empresas.

Responder2

O ato de reconstruir a matriz RAID pode levar muito tempo (dias) e ser muito difícil para os discos. Durante esse tempo de reconstrução, os discos sobreviventes ficam mais suscetíveis a falhas devido à sua atividade.

Antes de a reconstrução ser iniciada, os discos sobreviventes não correm grandes chances de falhar.

Por esse motivo, pode ser desaconselhável ter um "hot spare" no sistema, pois isso acionará automaticamente uma reconstrução e causará uma falha. Além disso, encontrar um erro de leitura irrecuperável durante a reconstrução pode causar uma falha na matriz, mesmo que nenhum outro disco tenha falhado. É melhor copiar os dados do array primeiro e depois reconstruí-los, se não houver backups recentes.

Responder3

Resposta curta SIM - O RAID 1+0 foi projetado ESPECIFICAMENTE devido à probabilidade de falha durante uma reconstrução do RAID5.

Resposta longa - Sim, há uma chance elevada de falha da unidade. No caso "mais óbvio/simples", pode-se argumentar que há mais calor sendo gerado, portanto, uma chance um pouco maior de falha. Dito isto, este não é o risco real.

O risco real é que, se as unidades foram compradas aproximadamente ao mesmo tempo, há uma chance muito elevada de que as unidades falhem aproximadamente ao mesmo tempo. Assim, a chance de a segunda unidade falhar durante a reconstrução aumenta. Infelizmente, este cenário não é académico – quanto maior for o esforço, mais longa será a reconstrução e maior será a probabilidade de fracasso. O RAID5 é geralmente aceito como sendo de poucos benefícios em grandes conjuntos de discos. A solução aceita é o raid 10 (lido como RAID one 1+0). Isso basicamente cria 2 conjuntos idênticos de dados em 2 conjuntos de arrays - portanto, usa muito mais espaço (quase o dobro) do que o RAID5, mas fornece proteção muito maior contra falhas de múltiplas unidades - o que é, infelizmente, comum em unidades de grande porte. .

informação relacionada