
私は、合計 10 ノード (5+5) の 2 台の IBM PureFlex サーバーに接続された OVirt バージョン 4.2.3.8-1.el7 を使用しています。
OVirt は突然すべてのノードへの接続を失いましたが、これらのノード内の VM は問題なく動作しています。すべてのノードで次のエラーが表示されています。
VDSM Node6 command GetCapabilitiesAsyncVDS failed: Message timeout which can be caused by communication issues
ノードは SSH でアクセス可能であり、OVirt 管理マシンからこれらのノードに SSH を実行できます。
OVirt 管理サーバーを一度再起動したところ、しばらくはノードに接続できましたが、しばらくすると問題が再発しました。
これを修正する方法を誰か教えてくれませんか?
答え1
私が提供できるのはチェックリストだけです:
すべてのノードからエンジン (管理マシン) に ping できますか? エンジンからすべてのノードに ping できますか?
何か変更しましたか? ノードまたはエンジンに更新を発行しましたか? エンジンのバックアップはありますか?
誰かが基盤となるネットワークを変更しましたか? 最近、ネットワーク上で IPv6 が有効になりましたか? IPv6 は VM 内では問題ありませんが、ovirt インフラストラクチャ (特に実行している oVirt のバージョン) では問題が発生する可能性があります。
さらに、非常に役立つoVirtコミュニティ。