
Ich verwende OVirt Version 4.2.3.8-1.el7, verbunden mit 2 IBM PureFlex-Servern mit insgesamt 10 Knoten (5+5).
OVirt hat plötzlich die Verbindung zu allen Knoten verloren, aber die VMs in diesen Knoten funktionieren ohne Probleme. Ich erhalte für alle Knoten den folgenden Fehler:
VDSM Node6 command GetCapabilitiesAsyncVDS failed: Message timeout which can be caused by communication issues
Knoten sind per SSH erreichbar und ich kann von der OVirt-Verwaltungsmaschine aus per SSH auf diese Knoten zugreifen.
Ich habe den OVirt-Verwaltungsserver einmal neu gestartet und er konnte eine Zeit lang eine Verbindung zu den Knoten herstellen, aber das Problem trat nach einer Weile erneut auf.
Kann mir jemand helfen, wie das behoben werden kann?
Antwort1
Ich kann Ihnen nur eine Checkliste geben:
Können Sie die Engine (Verwaltungsmaschine) von jedem Knoten aus anpingen? Können Sie alle Knoten von der Engine aus anpingen?
Haben Sie etwas geändert? Haben Sie Updates für die Knoten oder Engines herausgegeben? Haben Sie Engine-Backups?
Hat jemand das zugrunde liegende Netzwerk geändert? Wurde IPv6 kürzlich in Ihrem Netzwerk aktiviert? IPv6 ist innerhalb von VMs in Ordnung, aber für die ovirt-Infrastruktur (insbesondere die von Ihnen verwendete Version von oVirt) kann dies zu Problemen führen.
Zusätzlich können Sie versuchen, diesehr hilfreiche oVirt-Community.