在生產環境中將第二個 FC 交換器添加到結構的最佳實務?

在生產環境中將第二個 FC 交換器添加到結構的最佳實務?

我現在有一台 Brocade Silkworm 200e 交換器正在生產中。 corp Exchange 伺服器和 3 個 ESX 3.5 主機透過它連接到 clariion cx3 陣列。連接埠 0,1 為 SPA0 和 1,連接埠 4,5 為 SPB0 和 1。

我的計劃是在200 旁邊添加一台Brocade Silkworm 300 交換器(它已經安裝在機架上並已通電),前往數據中心,將SPA1 和SPB0 從200 中拔出,然後將它們插入300 交換機中的端口。

我對拔出生產中的 FC 路徑有點偏執。我有一個邏輯假設,事情只會故障轉移到 SPA0 和 SPB1,並且 A1 和 B0 不會被錯過。然而,如果可能的話,我想百分之百堅定地了解我可以採取哪些措施來進一步降低風險。

如果 LUN 目前由 SPA 擁有,它是否會自動以循環方式使用 SPA0 和 SPA1,或者交換器是否會獨佔特定路徑(除非發生故障)?範例 - Exchange 伺服器使用 SPA0 還是 SPA1,還是同時使用 0 和 1 主動/主動?

我猜測,如果它使用 SP 主動/主動的兩條路徑,則中斷其中一條路徑的風險較小,因為我確信它已經在毫無問題地使用另一條路徑。我害怕強制故障轉移到以前未使用過的備用路徑,然後發現電纜不穩定或其他什麼情況。

我是否應該徹底破壞公司並關閉所有虛擬機器和交換伺服器,以確保在發生故障轉移時不會發生資料損壞?或者這太過分了?不管怎樣,我將在完整備份週期後立即執行該操作。

當故障轉移發生時,您將如何監控它?錦200e會詳細紀錄嗎?我想要最大限度地保證當我拔掉這些插頭時一切仍然正常工作。我可以重新掃描 esx 主機上的儲存空間並觀察 Exchange 的電源路徑監視器。我還能做些什麼更好的事嗎?

當我們所有的雞蛋都在這個籃子裡時,我寧願比實際情況更加謹慎,也不願在第一次做這樣的事情時做出過度自信的假設。

答案1

我希望你的計劃是建立第二個獨立的結構,這通常被認為是一個好主意。

您沒有說明您的伺服器是否有多個 HBA。我希望如此,因為它將允許您正確地重新配置冗餘結構,但如果不是,它不會顯著影響您的近期計劃。

Powerpath 將處理 Exchange 伺服器的故障轉移,並且當 A0 斷開連接時應選擇通過 A1 的路徑,而不是 B0 或 B1,除非兩個 SPA 連接埠都發生故障。如果任何路徑無法運行,它會告訴您,或至少您不會看到您期望的路徑。根據您擁有的 Powerpath 版本(即 SE 版本或完全授權版本),您可能會啟用負載平衡多路徑策略,但在任何情況下,路徑故障轉移對於您所描述的設定都應該是可靠的。如果您碰巧斷開了活動路徑,Powerpath 將透過備用路徑重新路由發生故障的 IO(只要它們運作正常)。您可以在 Powerpath GUI 中檢查路徑狀態,也可以從命令列powermt check檢查失敗\新路徑,或powermt restore檢查並刪除\新增死\新路徑。如果已經為負載平衡設定了路徑策略,並且透過 SPA0 和 SPA1(例如)都有可見的健康路徑,那麼您就非常有信心一切正常。

在 ESX 伺服器上,您應該能夠從 VI Client->Configuration->Storage 標籤檢查每個 LUN 的可用路徑。在屬性中,您可以看到可用路徑,哪些是活動路徑,哪些是備用路徑,並且在「管理路徑」對話方塊中,您可以變更策略(固定\MRU\循環)。您不需要更改任何內容,但您再次需要確保您希望它使用的故障轉移路徑可用。同樣,ESX 的多路徑堆疊將處理故障轉移,如果 IO 在活動路徑上運行,如果檢測到失敗,它將在另一條路徑上重新發送它們。 ESX 3.5 僅實驗性地支援循環多路徑,因此在這種情況下您不想弄亂它。如果您想主動,您可以臨時設定固定路徑策略並強制 LUN 轉到您想要的路徑,但 CX3 的標準設定是將其保留為 MRU,這應該沒問題。

在這兩種情況下,在故障轉移發生之前可能會有一些延遲,IO 可能會短暫停止,但只要冗餘路徑實際上是健康的,就不會出現任何故障。

相關內容