OVirt 4.2 ノードへの接続が失われました

OVirt 4.2 ノードへの接続が失われました

私は、合計 10 ノード (5+5) の 2 台の IBM PureFlex サーバーに接続された OVirt バージョン 4.2.3.8-1.el7 を使用しています。

OVirt は突然すべてのノードへの接続を失いましたが、これらのノード内の VM は問題なく動作しています。すべてのノードで次のエラーが表示されています。

VDSM Node6 command GetCapabilitiesAsyncVDS failed: Message timeout which can be caused by communication issues

ノードは SSH でアクセス可能であり、OVirt 管理マシンからこれらのノードに SSH を実行できます。

OVirt 管理サーバーを一度再起動したところ、しばらくはノードに接続できましたが、しばらくすると問題が再発しました。

これを修正する方法を誰か教えてくれませんか?

答え1

私が提供できるのはチェックリストだけです:

  • すべてのノードからエンジン (管理マシン) に ping できますか? エンジンからすべてのノードに ping できますか?

  • 何か変更しましたか? ノードまたはエンジンに更新を発行しましたか? エンジンのバックアップはありますか?

  • 誰かが基盤となるネットワークを変更しましたか? 最近、ネットワーク上で IPv6 が有効になりましたか? IPv6 は VM 内では問題ありませんが、ovirt インフラストラクチャ (特に実行している oVirt のバージョン) では問題が発生する可能性があります。

さらに、非常に役立つoVirtコミュニティ

関連情報