我的伺服器似乎被詛咒了。每2-5天就會失敗一次 (我對這個東西還很陌生)
過去幾週我一直在努力尋找解決方案。但我顯然沒有任何進展。我發現的任何對 PSOD 的引用都與較舊的版本相關,直接由機器上運行的虛擬機、HP iLO 驅動程式或其他一些似乎不適用於我的問題的情況引起。
除了有關 vCenter Server 代理程式的資訊以及可能有關我的 10g NIC 的資訊之外,我無法從牆上的文字中獲得任何有用的信息? (我已經刪除了,以防萬一)
這裡是幾張照片。
我應該有更多,但我顯然沒有保存它們?
目前使用的硬體
- 主機板=超微 X9DRI-FO
- 中央處理器 = 2x至強 E5-2670
- 記憶體 = 32GB
- HBA = 2xSAS9211-8I
- 電源=700瓦
到目前為止我嘗試過的硬件
- 3塊主機板
- 超微 X9DRI-FO
- 英特爾至尊 dz77ga-70k
- 英特爾桌上型電腦主機板 DX58SO
- 2組CPU(雙插槽組和單插槽組)
- 至強 E5-2670
- Xeon X5650(這可能不是正確的CPU,但目前它已被埋沒
- 3 個電源
- 550瓦
- 700瓦
- 850瓦
- 2組測試RAM(一組ECC)
- 32GB DDR3 ECC
- 16GB DDR3
- 2 個安裝裝置(1 個旋轉 rust、1 個 USB)
我嘗試過的其他事情
- 重新安裝
- 重新下載安裝媒體並從不同(且相同)的 USB 隨身碟重新安裝
- 沒有虛擬機器在運行
我有點便宜了機殼,所以我對背板不是很有信心。我也嘗試過交換周圍的海灣。直接連接到主機板上的 SATA 連接
伺服器位於UPS,所以電源怪異不應該成為問題。
我 99% 確信我遺漏了一些明顯的東西,但是在將你的臉撞到牆上一段時間後,它開始變得很難看清。幸運的是,無論如何,我需要開始發布問題才能獲得代表。
答案1
當然,如果可能的話,您應該使用支援的硬體。還有針對 HPE 或 Dell 等不同供應商的驅動程式集。所以這可能只是驅動程式的問題。
我不明白的另一件事是,如果您已經重新安裝了 ESXi,為什麼還要使用 Build 4564106?
目前的版本是 7388607。