1 de los 3 discos duros (Western Digitial WD3003FZEX Black 3TB SATA 6GB/S 7200RPM 64MB Cache 3.5IN Hard Drive) falla en una matriz RAID 0. Al principio, desaparece del sistema operativo. Luego, reaparece después de volver a enchufar los cables, pero no es estable.
Funciona unas horas después del arranque/reinicio, mdadm puede leer el número de serie y ddrescue lee alrededor de 90 GB de datos a una velocidad promedio de 2 MB/s. Después de que aparece el problema, el número de serie queda vacío y ddrescue lee 0 bytes sin ninguna lectura exitosa.
I/O Controller : /sys/devices/pci0000:00/0000:00:1f.2 (SATA)
Port2 : /dev/sdd (WD-WMC5D0D9X6D8)
Port3 : /dev/sde (WD-WMC1F0EARDW0)
Port1 : /dev/sdc ()
Información inteligente cuando es normal
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 138 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 253 143 021 Pre-fail Always - 4966
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 236
5 Reallocated_Sector_Ct 0x0033 194 194 140 Pre-fail Always - 179
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 051 051 000 Old_age Always - 35906
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 213
16 Unknown_Attribute 0x0022 149 051 000 Old_age Always - 2633891565010
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 130
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 107
194 Temperature_Celsius 0x0022 119 081 000 Old_age Always - 33
196 Reallocated_Event_Count 0x0032 113 113 000 Old_age Always - 87
197 Current_Pending_Sector 0x0032 197 196 000 Old_age Always - 1765
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0
La placa base es ASUS X99-E USB 3.1, el RAID 0 está configurado con Intel RST y el controlador de E/S aún permanece en modo RAID en BIOS. Sin embargo, la matriz raid ahora solo consta de WD-WMC5D0D9X6D8 y WD-WMC1F0EARDW0 en BIOS; la unidad rota ahora es una unidad que no es miembro. El sistema debe detectar de alguna manera la falla de la unidad y eliminarla de la matriz automáticamente.
Me gustaría clonar la unidad que falla. ¿Debo seguir reiniciando la máquina? ¿Hay algún comando que pueda simplemente reiniciar/restablecer el disco duro en lugar de todo el sistema? ¿Alguna otra solución? Gracias.