
Estou usando o OVirt versão 4.2.3.8-1.el7 conectado a 2 servidores IBM PureFlex com 10 nós (5+5) no total.
OVirt perdeu repentinamente a conexão com todos os nós, mas as VMs nesses nós estão funcionando sem problemas. Estou recebendo o seguinte erro para todos os nós:
VDSM Node6 command GetCapabilitiesAsyncVDS failed: Message timeout which can be caused by communication issues
Os nós são acessíveis com SSH e posso fazer SSH para esses nós da máquina de gerenciamento OVirt.
Reiniciei o servidor de gerenciamento OVirt uma vez e ele conseguiu se conectar aos nós por um tempo, mas o problema ocorreu novamente depois de um tempo.
Alguém pode me ajudar como isso pode ser corrigido?
Responder1
Só posso lhe dar uma lista de verificação:
Você consegue executar ping no mecanismo (máquina de gerenciamento) de cada nó? Você consegue executar ping em todos os nós do mecanismo?
Você mudou alguma coisa? Você emitiu alguma atualização nos nós ou motores? Você tem backups de motor?
Alguém mudou a rede subjacente? O IPv6 foi ativado na sua rede recentemente? O IPv6 está ok nas VMs, mas para a infraestrutura do ovirt (especialmente a versão do oVirt que você está executando) isso pode causar problemas.
Além disso, você pode tentar entrar em contato com ocomunidade oVirt muito útil.