如何診斷 FreeNAS 系統上反覆出現的硬碟問題?

如何診斷 FreeNAS 系統上反覆出現的硬碟問題?

我在家中設定了一台 FreeNAS (11.2-U8) 伺服器,其中包含 8 個驅動器,其中包括採用 RAID-Z2 配置的 2TB Seagate Barracuda ST2000DM006 驅動器。

系統硬體的其餘部分如下:

  • 中央處理器:英特爾(R) 酷睿(TM) i3-4170 CPU @ 3.70GHz
  • 電源:EVGA 100-W1-0500-KR
  • 主機板:華擎 C226(支援 ECC)
  • 記憶體:NEMIX RAM 16GB (2 x 8GB) DDR3-1066MHz PC3-8500 (ECC)

此設定已運行 2.5 年,沒有出現任何問題,此後我開始在連接到連接埠 ADA7 的硬碟上出現 SATA 錯誤。在我看來,2.5 年很短,我決定將驅動器更換為具有更長保固期的“NAS 級”驅動器,因此我購買了 WD Red Pro WD2002FFSX。

成功重新同步池後,僅經過幾天的操作,我就開始在這個新驅動器上收到相同類型的 SATA 錯誤。

我開始懷疑這些電纜,因此我將 ADA6 和 ADA7 上的驅動器的 SATA 電纜的一端切換,連接 ADA6 上有問題的驅動器。錯誤一直被標記,但現在在 ADA6 上;消除了電纜損壞甚至主機板連接埠問題的可能性。

重新插入各自連接埠上的所有內容後,我開始切換 ADA6 和 ADA7 的電源線。 ADA7 上仍然存在錯誤,這意味著電源線是暢通的。

話雖這麼說,我的下一步調試是什麼?我不是這方面的專家,看起來要么我很不幸,有兩個壞驅動器,要么發生了其他事情,我不知道它是什麼。

我得到的錯誤如下:

Device: /dev/ada7, ATA error count increased from 2960 to 2961
Device: /dev/ada7, not capable of SMART self-check
Pool main state is DEGRADED: One or more devices has experienced an unrecoverable error. An attempt was made to correct the error. Applications are unaffected.

我必須提到所有硬碟都具有 SMART 功能。有時 NAS 運行幾天都沒有問題,然後它開始向我發送電子郵件,反覆報告問題。這確實是零星的行為。

答案1

我相信這是一個軟體問題。我無法準確指出,但在我的 NAS 上運行所有可能的更新(切換到最新更新列車 11.3 並運行所有池升級)似乎已經成功了。

自從我更新了所有內容以來,我已經運行了近兩個月,沒有任何問題。

相關內容