Wie repariert man eine eingefrorene QEMU-VM?

Wie repariert man eine eingefrorene QEMU-VM?

Ich habe einen QEMU-Hypervisor auf RHEL 6.4, der VMs hostet, die ziemlich oft ihre Verbindung zum Netzwerk verlieren. Wenn die VM ihre Verbindung verloren hat, kann ich sie über virt-manager anzeigen und mit ihr interagieren, aber es scheint nichts zu geben, was ich tun kann, um die Netzwerkverbindung wiederherzustellen. Das Pingen externer Hosts funktioniert nicht, das Aktualisieren der DHCP-Adresse funktioniert nicht und das Neustarten des Netzwerkdienstes funktioniert nicht.

An diesem Punkt kann ich die VM neu starten (entweder mit shutdown -r nowoder über die Benutzeroberfläche des Virt-Managers). Die VM scheint ordnungsgemäß heruntergefahren zu werden und erreicht den Punkt, an dem „System wird angehalten“ angezeigt wird.

Von da an reagiert die VM überhaupt nicht mehr. Ich kann nicht über den Virt-Manager darauf zugreifen, Virsh zeigt den VM-Status als „im Herunterfahren“ an und ich kann sie nicht über Virsh zerstören.

virsh # destroy vmname error: Fehler beim Zerstören der Domäne vmname error: Vorgang fehlgeschlagen: QEMU-Prozess konnte nicht mit SIGTERM beendet werden

Dies ist jetzt schon ein paar Mal passiert, jedes Mal mit den gleichen Symptomen einer verlorenen Netzwerkverbindung und einer eingefrorenen VM nach dem Neustart. Leider habe ich keine Kontrolle über den Hypervisor, daher kann ich nicht auf die Protokolldateien zugreifen und nur eine begrenzte Menge an Informationen von virsh abrufen.

Hat jemand diesen Fehler gesehen? Wird er durch die Konfiguration des Hypervisors oder der VMs verursacht?

Antwort1

Wenn Sie keine Kontrolle über den Hypervisor haben, sollten Sie sich an den Systemadministrator wenden, der die Kontrolle hat, und ihn bitten, das Ereignis zu untersuchen und entsprechende Protokollabschnitte zu Ihrer VM bereitzustellen. Unter keinen Umständen sollte ein Gast in der Lage sein, einen Destroy-Befehl von libvirt zu verzögern; es sollte sich um ein hartes Ausschalten handeln, wie das Herausziehen des Netzsteckers. Es handelt sich also entweder um einen Fehler im Setup des Hosts oder um einen Fehler in libvirt. In jedem Fall sollte der Administrator darüber Bescheid wissen.

verwandte Informationen