OVirt 4.2 Потеряно соединение с узлами

OVirt 4.2 Потеряно соединение с узлами

Я использую OVirt версии 4.2.3.8-1.el7, подключенный к 2 серверам IBM PureFlex с 10 узлами (5+5) в общей сложности.

OVirt внезапно потерял соединение со всеми узлами, но виртуальные машины в этих узлах работают без проблем. Я получаю следующую ошибку для всех узлов:

VDSM Node6 command GetCapabilitiesAsyncVDS failed: Message timeout which can be caused by communication issues

Узлы доступны по SSH, и я могу подключиться к этим узлам по SSH с машины управления OVirt.

Я перезапустил сервер управления OVirt один раз, и он некоторое время мог подключаться к узлам, но через некоторое время проблема возникла снова.

Может ли кто-нибудь помочь мне, как это можно исправить?

решение1

Я могу только дать вам контрольный список:

  • Можете ли вы пинговать движок (машину управления) с каждого узла? Можете ли вы пинговать все узлы с движка?

  • Вы что-нибудь меняли? Выпускали ли вы какие-либо обновления по узлам или двигателям? У вас есть резервные копии двигателей?

  • Кто-то изменил базовую сеть? Был ли IPv6 активирован в вашей сети недавно? IPv6 приемлем внутри виртуальных машин, но для инфраструктуры ovirt (особенно версии oVirt, которую вы используете) это может вызвать проблемы.

Кроме того, вы можете попытаться обратиться кочень полезное сообщество oVirt.

Связанный контент