
情境
我最近注意到我的 freeNAS 告訴我它的一個驅動器出現問題。我有大約 16 個壞扇區,經過了智慧測試等。 RAID Z2陣列中的6個磁碟機中,基本上沒有冗餘。
陣列開始重新同步,從未完成,並且總是告訴我錯誤太多(14k+)。我發現電源適配器部分實際上不太可能有兩個驅動器發生故障,特別是在打開機箱後第二個驅動器立即發生故障。我將其重新插入,ZFS 無法對其執行任何操作。
我最終用自己替換了舊驅動器(相同的驅動器,但 ZFS 無法識別它,在 gpt / smartctl / zpool 上匹配),並且 ZFS 返回重新同步。
當然,這仍然有所有相同的錯誤,現在我也無緣無故地重新同步了第三個驅動器,我做了一些ZFS 清除和擦洗,它仍然每天整天重新同步,失敗,我清除,重新同步更多,然後它無處可去。
除了我對 ZFS 無法從這種相對低風險的情況中恢復深感失望之外,實際上只有一個驅動器發生故障並被及時更換,NAS 及其主要且唯一的共享仍然可用,而且我無論如何,在第一次磁碟故障後完成了備份。
問題
有什麼方法可以讓 ZFS 明白這個池很好,它應該重新同步兩個新驅動器(其中一個是舊驅動器,我擦拭了它以幫助 ZFS 讓它可以使用它)並停止告訴我關於那些錯誤?
就像 resilver -force -scrub_later -everything_is_obviously_fine -or_i_couldnt_possible_use_the_share -just_mark_it_all_online -lets_get_back_to_actual_work_now 一樣?
漫布林
我有點擔心,因為現在它假裝對我來說,它正在重新同步 raidz2 池中 6 個驅動器中的 3 個,其中顯然有可用數據,我嚴重懷疑任何人都可以做到這一點。
我預計它很快就會增加多達 4 個驅動器,或者也許全部 6 個驅動器,為什麼不呢,從硬碟周圍空氣中積聚的殘留磁塵中重新創建我的所有數據。
任何建議表示讚賞。謝謝你!
答案1
我從未得到答案,事情在好轉之前變得更糟。總體而言,經過至少十幾次重新同步、清理、清除、刪除包含錯誤的檔案以及重新啟動後,它最終重新上線。
總而言之,我認為這主要意味著 ZFS 喜歡發出重大警告,並且 zpool 狀態並不完全清楚,因為在 raidz2 中重新同步 6 個驅動器中的 3 個驅動器在物理上是不可能的。
但大多數情況下,只要您的資料仍然可用,並且從共享使用的角度來看一切看起來都正常,那麼最終可能會像這裡一樣正常,只需繼續重新啟動、清理、清除和處理有校驗和錯誤的文件即可。