伺服器未正常關閉後出現叢集共享磁碟區錯誤

伺服器未正常關閉後出現叢集共享磁碟區錯誤

我們有兩台IBM X240伺服器(稱為伺服器A和伺服器B)透過光纖HBA連接到IBM磁碟系統:V3700。

兩台伺服器都安裝 Windows 2012 R2。

我們已經實現了虛擬機集群,一切運作良好。

上週,由於我的伺服器機房電力不足,這兩台伺服器停機了。

伺服器A開機後,會出現下列錯誤:

Windows 無法啟動,可能是最近的硬體或軟體變更造成的。檔案:\windows\system32\drivers\msdsm.sys 狀態:0xc0000017 資訊:無法載入作業系統,因為關鍵系統磁碟機遺失或包含錯誤。

使用Last Good Configuration後,我們就可以登入系統並開啟叢集虛擬機器了。

現在看來一切都很好。

於是我去啟動伺服器B,並使用與伺服器A相同的方法登入系統。

我發現由於叢集共享磁碟區錯誤,所有虛擬機器都會關閉或運行錯誤。

請參閱下面從系統日誌中捕獲的一些錯誤。

事件 5142,由於錯誤“(1460)”,無法再從此群集節點存取群集共享磁碟區“Volume7”(“群集磁碟 10”)。請對該節點與儲存設備的連接和網路連線進行故障排除。

事件 5120,由於“(c00000be)”,群集共享磁碟區“Volume3”(“群集磁碟 4”)已進入暫停狀態。所有 I/O 將暫時排隊,直到重新建立磁碟區的路徑。

現在我們只能打開一台伺服器並關閉另一台伺服器,如果我打開兩台伺服器,錯誤將再次出現並且伺服器將關閉。

任何建議或需要我提供更多資訊。

2015 年 5 月 28 日更新資訊:

我認為問題是無法從被動(非協調器)節點存取 CSV 磁碟區。

我還參考了以下文檔,但它也無法解決我的問題:

https://support.microsoft.com/en-us/kb/2008795?wa=wsignin1.0

使用 cmdlet 開啟兩個節點或任一節點時請參考下列結果:get-clustershardvolumestate

*打開兩個節點時: 在此輸入影像描述

當開啟任一節點時: 在此輸入影像描述

我還升級了兩個節點供應商 DSM 驅動程序,但結果是相同的。

相關內容