У меня есть гипервизор qemu на RHEL 6.4, на котором размещены виртуальные машины, которые довольно часто теряют подключение к сети. Когда виртуальная машина теряет подключение, я могу просматривать ее и взаимодействовать с ней с помощью virt-manager, но, похоже, я ничего не могу сделать, чтобы восстановить сетевое подключение. Пингование внешних хостов не работает, обновление адреса DHCP не работает, перезапуск сетевой службы не работает.
На этом этапе я могу перезапустить виртуальную машину (используя shutdown -r now
или используя virt-manager ui). Виртуальная машина будет корректно завершать работу, доходя до точки, где написано "Halting System".
С этого момента виртуальная машина полностью не отвечает. Я не могу получить к ней доступ через virt-manager, virsh показывает состояние виртуальной машины как «в выключении», и я не могу уничтожить ее через virsh.
virsh # уничтожить vmname ошибка: не удалось уничтожить домен vmname ошибка: операция не удалась: не удалось завершить процесс qemu с помощью SIGTERM
Это случалось уже пару раз, все с теми же симптомами потери сетевого соединения и зависания виртуальной машины после перезагрузки. К сожалению, у меня нет контроля над гипервизором, поэтому я не могу получить доступ к файлам журнала и могу только почерпнуть ограниченное количество информации из virsh.
Кто-нибудь видел этот баг? Это вызвано конфигурацией гипервизора или виртуальных машин?
решение1
Если у вас нет контроля над гипервизором, вам следует связаться с системным администратором, который им владеет, и попросить его расследовать событие и получить соответствующие разделы журнала, относящиеся к вашей виртуальной машине. Ни при каких обстоятельствах гость не должен иметь возможность остановить команду destroy из libvirt; предполагается, что это будет жесткое отключение питания, например, выдергивание вилки из розетки. Так что это либо ошибка в настройке хоста, либо ошибка в libvirt, в любом случае администратор должен знать об этом.