具有共用儲存的故障轉移 NFS 服務

具有共用儲存的故障轉移 NFS 服務

我需要配置一個具有共享儲存的集群,該儲存可以從節點 A 移動到節點 B,反之亦然。

如果節點 A 發生故障,節點 B 應接管與 NFS 服務關聯的 IP 位址、取得共用磁碟的所有權、安裝它並啟動 NFS 伺服器。

我使用的是 SUSE Linux 11.4。

到目前為止我使用的是HA叢集包和NFS。 NFS 正在共用節點 A 的驅動器,但如果節點 A 發生故障,節點 B 就會停止運作。

答案1

您可能想看看德魯布德,它提供類似於 RAID-1 的磁碟冗餘和網路共用。

Drbd 是一種區塊設備,旨在透過提供虛擬共享設備來建立高可用性集群,該虛擬共享設備使用 TCP/IP 使節點中的磁碟保持同步。這模擬了 RAID 1,但避免使用不常見的硬體(共用 SCSI 匯流排或光纖通道)。目前僅限於故障轉移 HA 集群。

如果您實際上正在運行大量虛擬化伺服器而不是 Beowulf 風格的 HPC 集群,您可能還想看看 google 的加內蒂,它可以使用 LVM 和 DRBD 來提供高可用性虛擬機,並在需要時自動遷移到其他節點。

Ganeti 是一個建立在 Xen 和 KVM 虛擬化技術以及其他免費軟體之上的虛擬伺服器叢集管理工具。它提供了一個自動化環境來管理高度可用的虛擬機器實例。

它旨在促進使用商用硬體的虛擬伺服器的叢集管理,並在物理故障後提供快速、簡單的復原。它可以負責冗餘磁碟建立和管理、作業系統安裝(與特定於作業系統的安裝腳本配合)、實體系統之間實例的啟動、關閉和故障轉移等操作。

我還沒有在生產中使用過 ganeti,但幾年前我在接受 OpenStack 集群工作之前對它進行了很多實驗(使用 OpenStack 基礎設施為全國各地大學的研究人員構建和運行虛擬 HPC 集群(澳大利亞)) ) 。 Ganeti 在我的測試中表現得非常好,我真的很欽佩它的構建和工作方式。

如果您環顧四周,您甚至可以找到一個附加模組,允許它使用 ZFS iscsi 導出而不是 VM 磁碟的 LVM+DRBD。

相關內容