SATA 硬碟錯誤

Question 1

根據我的經驗，您看到的錯誤實際上是軟體中反映的硬體錯誤。我在壞硬碟上看到「由於 I/O 錯誤導致頁面寫入遺失」訊息，其行為與您在嘗試對其進行 fsck 時所描述的方式類似。這幾乎肯定是真正的硬體故障。

您應該檢查 smartctl 的輸出，看看它說的可能是問題。

smartctl --attributes /dev/sdb

它會給你類似這樣的輸出：

=== 讀取智慧資料部分的開始 ===
SMART 屬性資料結構修訂號：16
具有閾值的供應商特定 SMART 屬性：
ID# ATTRIBUTE_NAME 標誌值 最差閾值類型已更新 WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000f 200 200 051 預失敗始終 - 0
  3 Spin_Up_Time 0x0003 212 186 021 始終為故障前 - 4358
  4 Start_Stop_Count 0x0032 100 100 000 Old_age 總是 - 97
  5 Reallocated_Sector_Ct 0x0033 200 200 140 故障前始終 - 0
  7 Seek_Error_Rate 0x000f 200 200 051 預失敗始終 - 0
  9 Power_On_Hours 0x0032 066 066 000 Old_age 總是 - 25420
 10 Spin_Retry_Count 0x0013 100 253 051 預失敗始終 - 0
 11 Calibration_Retry_Count 0x0013 100 253 051 預失敗始終 - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age 總是 - 86
194Temperature_Celsius 0x0022 104 001 000 Old_age 總是 - 46
196 Realated_Event_Count 0x0032 200 200 000 Old_age 總是 - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age 總是 - 0
198 Offline_Un Correctable 0x0010 200 200 000 Old_age 離線 - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age 總是 - 0
200 Multi_Zone_Error_Rate 0x0009 200 200 051 故障前離線 - 0

輸出可能很神秘，但我會密切關注的是Realulated_Sector_Ct，因為它告訴您硬碟對已知壞扇區的資訊。命令“smartctl -a”將提供更多數據。在我不久前遇到的壞高清上，該輸出的底部是“智慧錯誤日誌”，其中有一些條目。

Answer

根據我的經驗，您看到的錯誤實際上是軟體中反映的硬體錯誤。我在壞硬碟上看到「由於 I/O 錯誤導致頁面寫入遺失」訊息，其行為與您在嘗試對其進行 fsck 時所描述的方式類似。這幾乎肯定是真正的硬體故障。

您應該檢查 smartctl 的輸出，看看它說的可能是問題。

smartctl --attributes /dev/sdb

它會給你類似這樣的輸出：

=== 讀取智慧資料部分的開始 ===
SMART 屬性資料結構修訂號：16
具有閾值的供應商特定 SMART 屬性：
ID# ATTRIBUTE_NAME 標誌值 最差閾值類型已更新 WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000f 200 200 051 預失敗始終 - 0
  3 Spin_Up_Time 0x0003 212 186 021 始終為故障前 - 4358
  4 Start_Stop_Count 0x0032 100 100 000 Old_age 總是 - 97
  5 Reallocated_Sector_Ct 0x0033 200 200 140 故障前始終 - 0
  7 Seek_Error_Rate 0x000f 200 200 051 預失敗始終 - 0
  9 Power_On_Hours 0x0032 066 066 000 Old_age 總是 - 25420
 10 Spin_Retry_Count 0x0013 100 253 051 預失敗始終 - 0
 11 Calibration_Retry_Count 0x0013 100 253 051 預失敗始終 - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age 總是 - 86
194Temperature_Celsius 0x0022 104 001 000 Old_age 總是 - 46
196 Realated_Event_Count 0x0032 200 200 000 Old_age 總是 - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age 總是 - 0
198 Offline_Un Correctable 0x0010 200 200 000 Old_age 離線 - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age 總是 - 0
200 Multi_Zone_Error_Rate 0x0009 200 200 051 故障前離線 - 0

輸出可能很神秘，但我會密切關注的是Realulated_Sector_Ct，因為它告訴您硬碟對已知壞扇區的資訊。命令“smartctl -a”將提供更多數據。在我不久前遇到的壞高清上，該輸出的底部是“智慧錯誤日誌”，其中有一些條目。

Question 2

您遇到了無法修正的讀取錯誤。

Error: UNC at LBA = 0x03800922 = 58722594

該區塊上的資料現已遺失。

你應該：

首先要使用鏡子。企業磁碟實際上旨在位於鏡像後面，它們寧願返回讀取錯誤也不願努力獲取資料。
從備份中恢復遺失的數據

您沒有理由不使用 RAID（特別是如果您為客戶託管網站！） - 作業系統不是那麼大，您不需要在 2 磁碟系統上為其提供專用磁碟。

Answer

您遇到了無法修正的讀取錯誤。

Error: UNC at LBA = 0x03800922 = 58722594

該區塊上的資料現已遺失。

你應該：

首先要使用鏡子。企業磁碟實際上旨在位於鏡像後面，它們寧願返回讀取錯誤也不願努力獲取資料。
從備份中恢復遺失的數據

您沒有理由不使用 RAID（特別是如果您為客戶託管網站！） - 作業系統不是那麼大，您不需要在 2 磁碟系統上為其提供專用磁碟。

Question 3

您使用的是 RAID 控制器嗎？您使用哪種控制器？

其中一件事（既令人沮喪又具有啟發性）是 HDD 製造商正在將日益細分的硬碟引入 SATA 市場。現在有用於「小型企業/RAID 使用」和「單/桌面使用」的磁碟機。 SAS似乎被推向「高端企業」市場。

您的型號是 WD RE3 系列硬碟，專為 RAID 設定而設計。有人告訴我，這意味著在嘗試修復錯誤時，驅動器會更快地「放棄」（即在 3-4 秒內），而不是在更長的時間內一遍又一遍地嘗試。儘早放棄會將錯誤報告給 RAID 控制器，以便它可以使用另一個磁碟機來復原。相反，如果驅動器等待時間較長，RAID 控制器會因驅動器無響應而將該驅動器從陣列中踢出。

失敗應該仍然很少見，而且不是每年一次。也許這是你設置的另一個方面？（我曾經與 SATA 電纜進行過一次令人沮喪的鬥爭，現在它被安裝在我的門上，作為對其他電纜的警告...）

Answer

您使用的是 RAID 控制器嗎？您使用哪種控制器？

其中一件事（既令人沮喪又具有啟發性）是 HDD 製造商正在將日益細分的硬碟引入 SATA 市場。現在有用於「小型企業/RAID 使用」和「單/桌面使用」的磁碟機。 SAS似乎被推向「高端企業」市場。

您的型號是 WD RE3 系列硬碟，專為 RAID 設定而設計。有人告訴我，這意味著在嘗試修復錯誤時，驅動器會更快地「放棄」（即在 3-4 秒內），而不是在更長的時間內一遍又一遍地嘗試。儘早放棄會將錯誤報告給 RAID 控制器，以便它可以使用另一個磁碟機來復原。相反，如果驅動器等待時間較長，RAID 控制器會因驅動器無響應而將該驅動器從陣列中踢出。

失敗應該仍然很少見，而且不是每年一次。也許這是你設置的另一個方面？（我曾經與 SATA 電纜進行過一次令人沮喪的鬥爭，現在它被安裝在我的門上，作為對其他電纜的警告...）

Question 4

我在使用西部數據硬碟時有過非常糟糕的經歷。由於完全故障或壞扇區，我一半以上的驅動器在保固期內必須更換。

在只購買 WD 硬碟大約 8 年之後，我不再想在它們上花任何錢。我不知道哪個 WD 硬碟值得信賴；到目前為止，我的經驗表明「沒有一個」。

您已經更換過4次原廠驅動器；您是否同時購買了所有五個驅動器？當故障時，需要購買新的來更換嗎？在保固期內退回驅動器以進行更換？您是如何以及何時獲得這五個驅動器的？根據我的經驗，批量的 WD 硬碟經常會同時出現故障和故障。

Answer

我在使用西部數據硬碟時有過非常糟糕的經歷。由於完全故障或壞扇區，我一半以上的驅動器在保固期內必須更換。

在只購買 WD 硬碟大約 8 年之後，我不再想在它們上花任何錢。我不知道哪個 WD 硬碟值得信賴；到目前為止，我的經驗表明「沒有一個」。

您已經更換過4次原廠驅動器；您是否同時購買了所有五個驅動器？當故障時，需要購買新的來更換嗎？在保固期內退回驅動器以進行更換？您是如何以及何時獲得這五個驅動器的？根據我的經驗，批量的 WD 硬碟經常會同時出現故障和故障。

SATA 硬碟錯誤

答案1

答案2

答案3

答案4

相關內容