Preciso fazer migrações de host para host de hardware antigo para novo hardware. Especificamente, do HP BL460G7 ao HP BL460G8. Tanto o servidor antigo quanto o novo possuem 2 unidades de 600 GB de 2,5 "e estão configurados para RAID1. Posso pagar 30 minutos de inatividade por servidor.
São quatro servidores para migrar, o menor possui um total de 120GB alocados em volumes lógicos e o maior possui 510GB alocados. Três servidores estão executando RHEL5 e um está executando RHEL6.
Estou pensando em como fazer isso dentro do prazo determinado e sem destruir o sistema operacional e os dados críticos.
Meu único pensamento é este:
- remova uma unidade do servidor antigo (o servidor está ligado)
- remova ambas as unidades do novo servidor (o servidor está desligado)
- remova a unidade G7 do caddy e reserve
- remova a unidade G8 do caddy e instale no caddy G7
- instale a unidade G8 no caddy G7 no servidor antigo
- espere que o controlador RAID reconstrua a matriz RAID1
- quando terminar, desligue o servidor antigo
- remova a unidade G8 no caddy G7
- instale a unidade G8 no caddy G8 e insira no G8 (unidade única instalada)
- inicializar servidor G8
- espere o sistema operacional inicializar
- quando o sistema operacional inicializar, insira a unidade restante
- aguarde a reconstrução da matriz RAID
Isso parece sensato?
EDIT: O RHEL5 é RHEL5.10 e o RHEL6 é RHEL6.6
Eu também deveria ter observado que dois dos sistemas fazem parte de um cluster de quatro nós que faz replicação quase constante de "eventos" de aplicativos (faz parte de um sistema de infraestrutura crítica). Temos backups, mas só os utilizamos em caso de falha total do sistema.
Testes anteriores mostraram um 'dd' máximo entre sistemas de cerca de 50 MBps, o que é muito lento.
EDIT: Eu contaria com o kudzu para captar e lidar com as mudanças de hardware.
Responder1
Deve-se observar que podem ser necessárias outras etapas, dependendo da distribuição. Principalmente os drivers (obrigado por apontar isso @ewwhite).
- Inicialize o novo servidor a partir do livecd/usb.
- Prepare partições e bootblock nas novas unidades.
- Dependendo da configuração, isso pode ser feito copiando o MBR/bootblock.
- Faça os sistemas de arquivos.
- Faça um rsync do servidor antigo para o novo.
- Você pode querer fazer isso novamente para ver quanto tempo levará o rsync de acompanhamento - se for menos de 30 minutos, continue.
- Este é o momento que você pode realmente tentar, se o novo sistema for inicializado. Apenas tome cuidado para não causar conflitos de IP (ou outros).
- Desligue todos os serviços que gravariam no sistema de arquivos
- De preferência, reinicie para livecd/usb
- Dados Rsync do servidor antigo para o novo novamente
- Reinicie o novo servidor e use-o
Fazendo dessa forma, você ainda terá o servidor original intacto; portanto, se algo der errado, há um caminho fácil de volta. Mas requer algum conhecimento (grub/rsync/partitions), então sugiro fazer alguns trabalhos de preparação e testes com antecedência, antes de fazê-lo ao vivo.
Responder2
Duas coisas:
- Eu construiria novamente e sincronizaria os dados.
- Sua cota/janela de tempo de inatividade parece ser muito curta. 30 minutos podem funcionar em situações específicas, mas não deveriamVOCÊestar ditando o requisito realista de tempo de inatividade com base no que é necessário para realmente realizar o trabalho?
Dependendo dos dados contidos em cada servidor, a quantidade de dadosagitar, e seu esquema de provisionamento, pode fazer sentido instalar o sistema operacional necessário no novo Gen8 ProLiant e sincronizar as configurações e outras partes de dados em um ponto onde você possa desativar os dados.
Talvez faça uma cópia inicial e derive seu requisito de tempo de inatividade da quantidade de tempo que leva para captar as alterações do arquivo em rsyncs subsequentes. Se você precisar acelerar o processo de transferência ou tiver muitos arquivos pequenos, existemtécnicas que podem ajudar nisso.
Faço esse tipo de transição com frequência. Com instalações semelhantes do Linux, você raramente precisa de mais do que uma lista precisa de pacotes (facilmente obtida via Yum ou RPM), os diretórios de configuração (por exemplo, /etc
) e suas partições de dados. Se você ainda não possui um sistema de provisionamento kickstart, pode aproveitar o /root/anaconda-ks.cfg
arquivo para ter uma ideia de como o sistema G7 foi construído.
Para responder à sua pergunta sobre simplesmente mover os discos, com base nas versões específicas do RHEL que você mencionou, isso é absolutamente possível. Você pode mover os discos/caddies e os metadados do HP Smart Array são compatíveis entre os controladores P410 e P420 que podem estar em seus sistemas. No entanto, eu não faria isso sem primeiro atualizar totalmente o firmware das unidades e componentes do novo sistema.
Responder3
Se a versão anterior do seu sistema operacional for capaz de lidar com o novo hardware (principalmente controlador RAID), você pode tentarCloneZilla.
Para verificar se é possível passar de um hardware para outro você pode passar todos os dados do servidor antigo para o novo fazendo alguns truques com o dd.
Inicialize o novo servidor com uma distribuição ao vivo comoSystemRescueCD, configure com um endereço IP e um comando dd como este:
nc -l 8000 | dd of=/dev/sda
No servidor atual execute
dd if=/dev/sda | nc ${newserverip} 8000
Isso fará uma cópia bruta do /dev/sda do seu servidor para o novo servidor /dev/sda. Dessa forma, você pode realizar um teste sem tempo de inatividade em seu servidor original e correndo quase nenhum risco.
Responder4
O gerente do projeto negou meu pedido de uma janela de interrupção maior.
O procedimento proposto descrito na pergunta funcionou bem nos testes. O tempo de inatividade foi inferior a 20 minutos. Usei o utilitário hpacucli para monitorar o progresso no G7 e depois no Gen8, foi muito útil para isso.
Ainda não fiz isso com raiva, mas como afirmado, funcionou bem nos testes do RHEL 5.10 no BL460G7 ao BL460 Gen8.
Não atualizei o firmware.
A ressincronização inicial do RAID1 no G7 demorou pouco mais de uma hora. A ressincronização no Gen8 demorou menos de 50 minutos. Isso me preocupou, mas não consegui encontrar nenhum problema.
Obrigado novamente por todos os comentários e sugestões úteis.