
每個月,我的一台執行 VMware 4.1 的伺服器都會變得無回應。恢復它的唯一方法是進行硬重啟。發生這種情況時,我可以連接到 VMware,但除了導航和查看資訊之外無法執行任何操作。
伺服器是 Dell PowerEdge R210,配備兩個 1TB SATA 磁碟和 Dell SAS 6/iR Adapter Raid 控制器(鏡像磁碟,無電池)。我有另一台相同的伺服器運行沒有問題。
我現在已經更換了伺服器,以便能夠進行一些測試來解決這個問題。到目前為止,我已經:更新了 BIOS 和 Raid 控制器固件,重新安裝了 VMware,更換了所有 RAM 模組,但這並不能解決問題。
我嘗試在伺服器上安裝 Ubuntu,但僅在運行 VMware 時不存在該問題。
現在這種情況已經發生了大約 10 次,而且看起來在磁碟負載很大的情況下更有可能發生。
錯誤訊息是這樣的:
與儲存裝置 naa.600508e000000000a528c060b1275b09 的連線遺失。路徑 vmhba1:C1:T0:L0 已關閉。受影響的資料儲存:「」、「datastore1」、「Hypervisor1」、「Hypervisor2」、「Hypervisor3」。
由於連線問題,無法存取磁碟區 50520233-c467e816-a5a1-0026b97a4010 (datastore1)。恢復嘗試正在進行中,結果將很快報告。
以下是日誌條目: