У меня странная ситуация с моим Hosted Engine в oVirt.
У нас есть кластер oVirt, настроенный с использованием gluster в качестве хранилища для iso-образов двигателей и всей информации. Около недели назад два из трех серверов вышли из строя. Мы перезапускали машины около трех раз, и хосты gluster сообщили, что подключены, и не сообщили об ошибках split-brain.
Процесс hosted-engine пытался запустить hosted engine на одном из хостов, но он перешел в состояние EngineUnexpectedlyDown. И он вычитал 1600 из счета сервера, а затем пытался запустить его на следующей машине, пока все они не достигли счета около 800, и он просто пытался загрузиться на одной машине, а затем просто сидел там с сообщением «не удалось достичь vm».
Мы выяснили, что hosted-engine на самом деле загружается, так как мы можем подключиться к нему с помощью vnc-клиента. Но, похоже, он находится в каком-то заблокированном состоянии. Если вы войдете в hosted engine, даже как root, никакие файлы не могут быть изменены, а виртуальная машина недоступна никакими другими способами.
Есть ли способ узнать, заблокирована ли виртуальная машина/доступна ли она только для чтения? И можно ли как-то снять эту блокировку?
решение1
Если предположить, что вы использовали реплику 3, то при выходе из строя 2 хостов файловая система становится доступной только для чтения, и это может в какой-то степени объяснить то, что вы сейчас видите. В большинстве случаев следует ожидать, что виртуальная машина зависнет, поскольку qemu не сможет записать данные в хранилище, но мне нужно больше информации об этом, поэтому здесь нужны файлы журналов с хостов.
Прежде всего давайте убедимся, что статус можно прочитать из хранилища, и добиться этого можно, выполнив следующую команду с одного из хостов:
hosted-engine --vm-status
Если это сработает, попробуйте перевести хост в режим глобального обслуживания:
hosted-engine --set-maintenance --mode=global
Если это не сработает, это означает, что возникли проблемы с доступом к файлу метаданных в хранилище и, возможно, он доступен только для чтения.
Если это сработает, виртуальная машина будет находиться в режиме обслуживания, что позволит вам проверить состояние файлов внутри виртуальной машины и при необходимости перезагрузить виртуальную машину на том же хосте.