OVirt 4.2 perdeu conexão com nós

OVirt 4.2 perdeu conexão com nós

Estou usando o OVirt versão 4.2.3.8-1.el7 conectado a 2 servidores IBM PureFlex com 10 nós (5+5) no total.

OVirt perdeu repentinamente a conexão com todos os nós, mas as VMs nesses nós estão funcionando sem problemas. Estou recebendo o seguinte erro para todos os nós:

VDSM Node6 command GetCapabilitiesAsyncVDS failed: Message timeout which can be caused by communication issues

Os nós são acessíveis com SSH e posso fazer SSH para esses nós da máquina de gerenciamento OVirt.

Reiniciei o servidor de gerenciamento OVirt uma vez e ele conseguiu se conectar aos nós por um tempo, mas o problema ocorreu novamente depois de um tempo.

Alguém pode me ajudar como isso pode ser corrigido?

Responder1

Só posso lhe dar uma lista de verificação:

  • Você consegue executar ping no mecanismo (máquina de gerenciamento) de cada nó? Você consegue executar ping em todos os nós do mecanismo?

  • Você mudou alguma coisa? Você emitiu alguma atualização nos nós ou motores? Você tem backups de motor?

  • Alguém mudou a rede subjacente? O IPv6 foi ativado na sua rede recentemente? O IPv6 está ok nas VMs, mas para a infraestrutura do ovirt (especialmente a versão do oVirt que você está executando) isso pode causar problemas.

Além disso, você pode tentar entrar em contato com ocomunidade oVirt muito útil.

informação relacionada