OVirt 4.2 Se perdió la conexión a los nodos

OVirt 4.2 Se perdió la conexión a los nodos

Estoy usando OVirt versión 4.2.3.8-1.el7 conectado a 2 servidores IBM PureFlex con 10 nodos (5+5) en total.

OVirt perdió repentinamente la conexión con todos los nodos, pero las máquinas virtuales de estos nodos funcionan sin problemas. Recibo el siguiente error para todos los nodos:

VDSM Node6 command GetCapabilitiesAsyncVDS failed: Message timeout which can be caused by communication issues

Se puede acceder a los nodos con SSH y puedo hacer SSH a estos nodos desde la máquina de administración OVirt.

Reinicié el servidor de administración OVirt una vez y pude conectarme a los nodos por un tiempo, pero el problema volvió a ocurrir después de un tiempo.

¿Alguien puede ayudarme a solucionar esto?

Respuesta1

Sólo puedo darte una lista de verificación:

  • ¿Se puede hacer ping al motor (máquina de gestión) desde cada nodo? ¿Puedes hacer ping a todos los nodos desde el motor?

  • ¿Cambiaste algo? ¿Ha publicado alguna actualización sobre los nodos o motores? ¿Tienes respaldos de motor?

  • ¿Alguien cambió la red subyacente? ¿Se activó IPv6 en su red recientemente? IPv6 está bien en las máquinas virtuales, pero para la infraestructura de ovirt (especialmente la versión de oVirt que estás ejecutando) esto puede causar problemas.

Además, puede intentar comunicarse con elcomunidad oVirt muy útil.

información relacionada