FakeRAID 陣列故障,為什麼?

FakeRAID 陣列故障,為什麼?

我們有一個帶有 AMD 主機板 (GA-890GPA-UD3H) 的 Windows XP 系統,並且我們正在使用板載 RAID 功能。系統配置為 RAID 1(使用 AMD RAIDXpert 工具)。它由兩個 500GB 三星 HD502IJ 硬碟組成。

問題是陣列經常發生故障。給出的錯誤訊息是:Logical drive goes critical.因此,驅動器不再鏡像。

我可以重建驅動器,但這並沒有多大幫助。該錯誤不規則/不穩定地重複。有時3天就失敗,有時7天就失敗,所以不穩定。

有什麼問題以及如何證明它?我可以獲取有關驅動器的 SMART 信息,並且它們單獨運行都很好。

答案1

安裝在各種 NAS(具有硬體 RAID)中的消費性(WD 和日立)硬碟也存在同樣的問題。

經過多次實驗,我發現我的問題與磁碟處理讀取延遲和超時的不同方式有關。

我必須在驅動器韌體上啟用 TLER/CCTL。從那時起,數組就完美地工作了。

也可以看看http://en.wikipedia.org/wiki/Error_recovery_control

答案2

我在使用三星驅動器和 AMD 晶片組(在 HP 微型伺服器中)時遇到了很多問題。我相信這是一個780G晶片組。

我使用 Linux,由於驅動器上的吞吐量很高,我會收到日誌訊息,抱怨控制器沒有及時回應並被重置。最終它破壞了陣列。關閉 AHCI 並降級到 SATA1 有一點幫助,但並沒有完全解決問題。

一位擁有相同硬體的朋友在 Windows Home Server 上也遇到了同樣的問題,儘管我不記得日誌中說了什麼。

您能在 eventvwr 中看到有關驅動器的任何資訊嗎?

相關內容