Proliant ML310e Gen8 智慧陣列 SSD 的預測故障問題

Proliant ML310e Gen8 智慧陣列 SSD 的預測故障問題

這是一個與此相關的問題:

ProLiant Gen8 伺服器中的第三方 SSD 解決方案

但不包含在問題或答案中。

我在 Proliant ML310e Gen8 伺服器上有一個 OCZ 120 gig SSD 作為系統驅動器,位於 SATA 連接埠 6 上。這為我提供了一組 HDD 驅動器的 4 個托架。

到目前為止,一切都很好。我還在系統磁碟機上安裝了 Win Server 2008 R2,一切正常。

但是 - 當我檢查 SMART Array 時,它顯示“驅動器 0 (SSD) 預測故障”。我已經檢查並驗證了 SSD 的實際 SMART 設置,驅動器 100% 正常。它是全新的,SMART 設定已被 OCZ 支援驗證為 100% 正常。

我無法在 HP 診斷方面清除此錯誤,根據 OCZ 的建議,我一直在嘗試找出如何關閉 HP 上的 SMART 診斷,但無濟於事。

那麼-我如何清除 OCZ SSD SMART 資料的 HP SMART 陣列(不正確)診斷讀取,或如何關閉 HP 從 SSD 讀取 SMART 統計資料。

我意識到這完全是我自己的錯,因為我不想花 1000 多美元購買 HP 品牌 SSD,但 OCZ 運作得很好。只是 OCZ 版本的 SMART 與 HP 針對 SSD 驅動器統計數據的 SMART 理念不同,而且我真的厭倦了黃色閃爍的“系統降級”前面板燈。

是的,我已經被告知「在上面貼上黑色電工膠帶」。 :-)

但我真的很想找到更好的解決方案。這種 SMART 的東西應該​​是準通用的。

答案1

我在內建b120i 連接埠5/6 上運行帶有SATA SSD 的ML310e Gen8 v2(無陣列/jbod - 僅使用控制器使連接埠6 可引導),並找到了一種解決方案來阻止SSD 驅動器在重新啟動時顯示為失敗!這是運行 linux/zfs 的家庭實驗室,但我肯定會在生產中使用。

  1. 開啟智慧型儲存管理器 (SSA) - 一旦偵測到控制器,我就使用 F5 在 POST 上執行此操作。您也可以透過智慧型配置 (F10) 來完成。

  2. 轉到修改控制器設定並停用“表面掃描分析優先級”。這將阻止控制器嘗試對 SSD 進行表面掃描,從而阻止它們被標記為失敗。

  3. 享受第 3 方 SATA SSD,而不會因啟動失敗而停用。

HP Smart Storage Administrator 使用者指南提供了解決方案的提示。表面掃描模式似乎會導致 SSD 被標記為失敗的問題。本手冊展示了訪問SSA 的其他方式- 我相信可以使用ssacli 工具(也可以通過串行/iLo?)關閉每個插槽的SurfaceScanmode,如果您確實想在其他驅動器上使用它(但是我沒有嘗試過)因為我不使用任何陣列控制器功能...而是使用智慧監控)

根據 SSA 使用者指南,此設定也應適用於 Gen9。另外,Gen6、Gen7(透過下載映像存取 SSA) - 我懷疑 Gen5 也可以工作,因為它支援 ssacli。

答案2

但是OCZ SSD不是工作正常...它可能沒有正確向控制器報告其溫度。

你的惠普 ProLiant ML310eGen8 伺服器具有嵌入式“動態”智慧陣列 B120i 控制器在主機板上。這是一個“softraid”設備。這是伺服器中唯一的磁碟嗎?從你的問題中並不清楚。如果沒有的話,哪裡有其他磁碟已連線?

這個設定有很多限制,我不知道該告訴你什麼。

  • 這是一個軟體輔助的 RAID 控制器。
  • 它的 6 個連接埠中只有 2 個是 6Gbps。這就是為什麼我要問伺服器裡面還有什麼。
  • 它僅支援 SATA 設備。
  • 許多情況需要停用 RAID 功能。
  • 沒有緩存。

您的具體問題可能只是 OCZ 驅動器(反正他們已經破產了)。如果可以的話嘗試使用另一個 SSD。

編輯:

我會跳過在此伺服器中使用非 RAID SSD,而僅依賴您的(4?)內部磁碟托架。

在 HP ProLiant 世界中,您可以建立多個邏輯驅動器在物理陣列上。因此,使用您的磁碟組陣列配置實用程式為您的作業系統開闢一個 120GB 邏輯驅動器,然後將剩餘空間分配給資料。 Smart Array B120i 支援 8 個邏輯驅動器,因此這是處理此問題的最流暢方法...除非您需要固態硬碟。但對於這個伺服器來說似乎沒有必要。

相關內容