HDD 3개 중 1개(Western Digitial WD3003FZEX 블랙 3TB SATA 6GB/S 7200RPM 64MB 캐시 3.5IN 하드 드라이브)가 RAID 0 어레이에서 실패합니다. 처음에는 OS에서 사라집니다. 그런 다음 케이블을 다시 연결하면 다시 나타나지만 안정적이지 않습니다.
부팅/재부팅 후 몇 시간 후에 작동하고 mdadm은 일련 번호를 읽을 수 있으며 ddrescue는 평균 2MB/s 속도로 약 90GB의 데이터를 읽습니다. 문제가 발생한 후 일련 번호는 비어 있고 ddrescue는 성공적으로 읽히지 않은 채 0바이트를 읽습니다.
I/O Controller : /sys/devices/pci0000:00/0000:00:1f.2 (SATA)
Port2 : /dev/sdd (WD-WMC5D0D9X6D8)
Port3 : /dev/sde (WD-WMC1F0EARDW0)
Port1 : /dev/sdc ()
평소에도 스마트한 정보
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 138 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 253 143 021 Pre-fail Always - 4966
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 236
5 Reallocated_Sector_Ct 0x0033 194 194 140 Pre-fail Always - 179
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 051 051 000 Old_age Always - 35906
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 213
16 Unknown_Attribute 0x0022 149 051 000 Old_age Always - 2633891565010
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 130
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 107
194 Temperature_Celsius 0x0022 119 081 000 Old_age Always - 33
196 Reallocated_Event_Count 0x0032 113 113 000 Old_age Always - 87
197 Current_Pending_Sector 0x0032 197 196 000 Old_age Always - 1765
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0
마더보드는 ASUS X99-E USB 3.1이고 RAID 0은 Intel RST로 설정되어 있으며 I/O 컨트롤러는 여전히 BIOS에서 RAID 모드로 남아 있습니다. 그러나 RAID 어레이는 현재 BIOS에서 WD-WMC5D0D9X6D8 및 WD-WMC1F0EARDW0으로만 구성되며, 손상된 드라이브는 이제 비멤버 드라이브입니다. 시스템은 어떻게든 드라이브 오류를 감지하고 이를 어레이에서 자동으로 제거해야 합니다.
실패한 드라이브를 복제하고 싶습니다. 머신을 계속 재부팅해야 합니까? 전체 시스템이 아닌 HDD만 재부팅/재설정할 수 있는 명령이 있나요? 다른 해결 방법이 있나요? 감사합니다.