
我使用 OVirt 版本 4.2.3.8-1.el7 連接到 2 台 IBM PureFlex 伺服器,總共 10 個節點 (5+5)。
OVirt 突然失去了與所有節點的連接,但這些節點中的虛擬機器正在正常運作。我收到所有節點的以下錯誤:
VDSM Node6 command GetCapabilitiesAsyncVDS failed: Message timeout which can be caused by communication issues
可以透過 SSH 存取節點,我可以從 OVirt 管理電腦透過 SSH 存取這些節點。
我已經重新啟動了 OVirt 管理伺服器一次,它可以連接到節點一段時間,但過了一段時間問題又出現了。
誰能幫我解決這個問題嗎?
答案1
我只能給你一個檢查清單:
您可以從每個節點 ping 引擎(管理機)嗎?您可以從引擎 ping 所有節點嗎?
你改變了什麼嗎?您是否發布了節點或引擎的更新?您有引擎備份嗎?
有人改變了底層網路嗎?您的網路最近啟動了 IPv6 嗎? IPv6 在虛擬機器中沒問題,但對於 ovirt 基礎架構(尤其是您正在執行的 oVirt 版本)來說,這可能會導致問題。
此外,您可以嘗試聯繫oVirt 社群非常有幫助。