Na sexta-feira tive um desastre absoluto. Fui ao datacenter para montar um novo servidor e, ao mesmo tempo, levei comigo um novo disco para substituir uma unidade que havia falhado algumas semanas atrás em um array iSCSI HP P2000 G3 de 10 Gbit.
O P2000 é carregado com 12 discos MDL SAS de 2 TB e 7,2k e configurado como 2 arrays RAID10, cada um com 4 unidades + 2 peças de reposição. Eu já havia removido o disco com falha uma semana antes, seu lugar no array foi ocupado automaticamente por um dos hot parts conforme esperado.
Portanto, a tarefa em questão era uma simples substituição da unidade para me devolver um hot spare. Simples, certo? Deslize o disco, certifique-se de que esteja visível na GUI e configure como hot spare....
Não...
Abri o novo disco da embalagem e o coloquei no lugar, instantaneamente todas as unidades do array ficaram laranja. Verifiquei a GUI e cada disco mostrava 'Metadados inválidos'. Uma verificação rápida dos serviços em execução usando os dois arrays confirmou que tudo havia perdido a visibilidade dos LUNs.
Verifiquei novamente os canais e reiniciei os controladores, sem efeito. As unidades começaram a desaparecer da GUI e meus VDs (LUNs) também estavam faltando na GUI. Também removi o novo disco, ainda nada.
Em um ato de desespero e confusão, desliguei o P2000 e deixei-o reiniciar totalmente. Ele voltou a ficar online e eu pude ver meus VDs novamente... No entanto, ambos os arrays perderam toda a redundância, como se cada metade dos 2 RAID10 tivessem perdido seus discos espelhados.
Todos os outros discos que antes faziam parte da matriz agora eram exibidos como disponíveis. Consegui configurá-los como peças de reposição e os 2 RAID10 começaram a reconstrução. Agora ele está funcionando novamente, mesmo sem meu novo disco, pois estou com muito medo de colocá-lo novamente.
Alguém tem alguma ideia do que aconteceu aqui?
A única coisa que consigo pensar é que o novo disco deve conter metadados próprios e confundir o P2000. No entanto, era um novo disco lacrado do nosso fornecedor habitual. No entanto, mesmo que fosse esse o caso, eu não esperaria que o array fizesse algo com aquele disco que afetasse a configuração RAID existente!
Ajuda por favor!
Responder1
Sempre há uma chance de o disco ser uma unidade reciclada. Tem certeza de que o erro foi "metadados inválidos" ou algo como:"Metadados obsoletos".
Se o inversor ainda estiver reportando isso, selecione P2000 no SMU e navegue até: Tools > Clear Disk Metadata
para o inversor específico.
Deixe-me saber se a mensagem de erro foi algo diferente.