HDD는 부팅/재부팅 후 몇 시간만 작동합니다.

HDD는 부팅/재부팅 후 몇 시간만 작동합니다.

HDD 3개 중 1개(Western Digitial WD3003FZEX 블랙 3TB SATA 6GB/S 7200RPM 64MB 캐시 3.5IN 하드 드라이브)가 RAID 0 어레이에서 실패합니다. 처음에는 OS에서 사라집니다. 그런 다음 케이블을 다시 연결하면 다시 나타나지만 안정적이지 않습니다.

부팅/재부팅 후 몇 시간 후에 작동하고 mdadm은 일련 번호를 읽을 수 있으며 ddrescue는 평균 2MB/s 속도로 약 90GB의 데이터를 읽습니다. 문제가 발생한 후 일련 번호는 비어 있고 ddrescue는 성공적으로 읽히지 않은 채 0바이트를 읽습니다.

I/O Controller : /sys/devices/pci0000:00/0000:00:1f.2 (SATA)
          Port2 : /dev/sdd (WD-WMC5D0D9X6D8)
          Port3 : /dev/sde (WD-WMC1F0EARDW0)
          Port1 : /dev/sdc ()

평소에도 스마트한 정보

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   138   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   253   143   021    Pre-fail  Always       -       4966
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       236
  5 Reallocated_Sector_Ct   0x0033   194   194   140    Pre-fail  Always       -       179
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   051   051   000    Old_age   Always       -       35906
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       213
 16 Unknown_Attribute       0x0022   149   051   000    Old_age   Always       -       2633891565010
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       130
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       107
194 Temperature_Celsius     0x0022   119   081   000    Old_age   Always       -       33
196 Reallocated_Event_Count 0x0032   113   113   000    Old_age   Always       -       87
197 Current_Pending_Sector  0x0032   197   196   000    Old_age   Always       -       1765
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

마더보드는 ASUS X99-E USB 3.1이고 RAID 0은 Intel RST로 설정되어 있으며 I/O 컨트롤러는 여전히 BIOS에서 RAID 모드로 남아 있습니다. 그러나 RAID 어레이는 현재 BIOS에서 WD-WMC5D0D9X6D8 및 WD-WMC1F0EARDW0으로만 구성되며, 손상된 드라이브는 이제 비멤버 드라이브입니다. 시스템은 어떻게든 드라이브 오류를 감지하고 이를 어레이에서 자동으로 제거해야 합니다.

실패한 드라이브를 복제하고 싶습니다. 머신을 계속 재부팅해야 합니까? 전체 시스템이 아닌 HDD만 재부팅/재설정할 수 있는 명령이 있나요? 다른 해결 방법이 있나요? 감사합니다.

관련 정보