
我們有兩台IBM X240伺服器(稱為伺服器A和伺服器B)透過光纖HBA連接到IBM磁碟系統:V3700。
兩台伺服器都安裝 Windows 2012 R2。
我們已經實現了虛擬機集群,一切運作良好。
上週,由於我的伺服器機房電力不足,這兩台伺服器停機了。
伺服器A開機後,會出現下列錯誤:
Windows 無法啟動,可能是最近的硬體或軟體變更造成的。檔案:\windows\system32\drivers\msdsm.sys 狀態:0xc0000017 資訊:無法載入作業系統,因為關鍵系統磁碟機遺失或包含錯誤。
使用Last Good Configuration後,我們就可以登入系統並開啟叢集虛擬機器了。
現在看來一切都很好。
於是我去啟動伺服器B,並使用與伺服器A相同的方法登入系統。
我發現由於叢集共享磁碟區錯誤,所有虛擬機器都會關閉或運行錯誤。
請參閱下面從系統日誌中捕獲的一些錯誤。
事件 5142,由於錯誤“(1460)”,無法再從此群集節點存取群集共享磁碟區“Volume7”(“群集磁碟 10”)。請對該節點與儲存設備的連接和網路連線進行故障排除。
事件 5120,由於“(c00000be)”,群集共享磁碟區“Volume3”(“群集磁碟 4”)已進入暫停狀態。所有 I/O 將暫時排隊,直到重新建立磁碟區的路徑。
現在我們只能打開一台伺服器並關閉另一台伺服器,如果我打開兩台伺服器,錯誤將再次出現並且伺服器將關閉。
任何建議或需要我提供更多資訊。
2015 年 5 月 28 日更新資訊:
我認為問題是無法從被動(非協調器)節點存取 CSV 磁碟區。
我還參考了以下文檔,但它也無法解決我的問題:
https://support.microsoft.com/en-us/kb/2008795?wa=wsignin1.0
使用 cmdlet 開啟兩個節點或任一節點時請參考下列結果:get-clustershardvolumestate
*打開兩個節點時:
當開啟任一節點時:
我還升級了兩個節點供應商 DSM 驅動程序,但結果是相同的。