我們正在 4 節點 VCS 叢集上進行兩年一次的彈性測試。兩個應用程式分別在節點 1-3 和 2-4 上運行。處於主備模式。
當在一個節點上進行手動切換或正常關閉時,應用程式將很好地切換到另一個節點。
然而,當我們關閉或重置節點時,受影響的節點觸發器似乎沒有進行切換重新啟動其他叢集節點。更重要的是,如果關閉,其餘節點會重新啟動,但是加入集群失敗。當被殺死的伺服器恢復時,所有伺服器再次加入。
顯然,這完全違背了集群的目的。我們提供應用程式和叢集軟體(以及硬體)的供應商提出,這種情況是不切實際的,伺服器在出現故障時總是能很好地切換。
我們沒有專有集群技術的專業知識,因此雖然我們假設他們的陳述不正確,但我們不知道可能出了什麼問題。然而,我懷疑任何商業上成功的叢集軟體都可以處理這些情況,但我們的實作會遇到配置錯誤。
任何線索將不勝感激。