如何避免因磁碟壞道而導致資料遺失？

Question 1

鑑於您假設資料儲存最終總是會失敗，您只需要保留多份副本數據，偶爾檢查並確保可以成功讀取數據。

使用某種類型的 RAID 聽起來像是擁有至少一個備份副本的好方法，但額外的副本是一個好主意，至少出於不將所有副本保留在同一建築物、房間和機器中的明顯原因。線上備份是讓其他人擔心他們的驅動器故障的好方法。

為了確保資料仍然可讀，只需保留自己的校驗和並定期驗證它們即可。一個基本的 CRC 就可以工作，例如cksumGNU 的核心實用程序，甚至是 md5sum 或 shaXsum（儘管在我看來，它們對於壞扇區來說太過殺傷力了）。

_{[出於顯而易見的原因，並保留一些校驗和文件的副本。}

即使 ZFS 有自己的校驗和，您仍然應該保留自己的副本，以驗證儲存在其他檔案系統或線上的副本。我假設你或 ZFS 無論如何都必須讀取所有檔案來驗證它們（我相信它被稱為ZFS 資料清理，用zpool scrub) 顯式調用。

考慮到許多驅動器（尤其是閃存驅動器）都有自己的壞塊管理（和磨損均衡），將壞塊和邊緣塊替換為新的備用塊，所有（大部分）都是默默地進行，您或操作系統甚至都沒有註意到，這也很有趣。我曾經讀到過有關閃存卡的內容，16GB 的內存中只有足夠好的內存來製作 512MB 或 1G 的卡。

Answer

鑑於您假設資料儲存最終總是會失敗，您只需要保留多份副本數據，偶爾檢查並確保可以成功讀取數據。

使用某種類型的 RAID 聽起來像是擁有至少一個備份副本的好方法，但額外的副本是一個好主意，至少出於不將所有副本保留在同一建築物、房間和機器中的明顯原因。線上備份是讓其他人擔心他們的驅動器故障的好方法。

為了確保資料仍然可讀，只需保留自己的校驗和並定期驗證它們即可。一個基本的 CRC 就可以工作，例如cksumGNU 的核心實用程序，甚至是 md5sum 或 shaXsum（儘管在我看來，它們對於壞扇區來說太過殺傷力了）。

_{[出於顯而易見的原因，並保留一些校驗和文件的副本。}

即使 ZFS 有自己的校驗和，您仍然應該保留自己的副本，以驗證儲存在其他檔案系統或線上的副本。我假設你或 ZFS 無論如何都必須讀取所有檔案來驗證它們（我相信它被稱為ZFS 資料清理，用zpool scrub) 顯式調用。

考慮到許多驅動器（尤其是閃存驅動器）都有自己的壞塊管理（和磨損均衡），將壞塊和邊緣塊替換為新的備用塊，所有（大部分）都是默默地進行，您或操作系統甚至都沒有註意到，這也很有趣。我曾經讀到過有關閃存卡的內容，16GB 的內存中只有足夠好的內存來製作 512MB 或 1G 的卡。

Question 2

關於 RAID 5/6

RAID 5/6 有奇偶校驗資料。

如果它可以重建整個磁碟，那麼肯定有足夠的奇偶校驗資料來還原單一磁區。

最糟糕的情況是，您檢測到壞扇區，更換整個驅動器，現在一切都已重建。

因此，如果 RAID 5/6 偵測到壞磁區應該自動使用奇偶校驗資料來修復它。

我的 Adaptec RAID 控制器甚至在 GUI 中具有特殊的「驗證/修復」選項。

另請注意校驗和、sha1、sha2、CRC 等僅提供偵測何時發生錯誤的能力。它確實提供了修復它們的能力。

Answer