Diagnóstico de falla de Windows/HDD/RAID0

Diagnóstico de falla de Windows/HDD/RAID0

Mi maquina es la siguiente:

  • Par de discos duros en RAID0, ATA Hitachi HDT72505
  • ¿Placa base nVidia, "M51"?

Windows XP se negó a arrancar:

  • El inicio normalmente provoca que se cuelgue durante la pantalla de carga de Windows.
  • Al iniciar en modo seguro, puede acceder a la pantalla de inicio de sesión. Al iniciar sesión se cuelga.

Usando el CD de instalación de Windows XP:

  • No detecta ninguno de los discos duros.
  • Si hay un disco duro externo conectado, el CD montará ese disco duro mientras se usa la consola de recuperación.

Por suerte, tengo un DVD de Kubuntu 9.10.

fdisk -lmuestra esta salida:

Disco /dev/sda: 500,1 GB, 500107862016 bytes
255 cabezas, 63 sectores/pista, 60801 cilindros
Unidades = cilindros de 16065 * 512 = 8225280 bytes
Identificador de disco: 0xc0cfc0cf

   Dispositivo Arranque Inicio Bloques finales Sistema de identificación
/dev/sda1 * 1 60801 488384001 7 HPFS/NTFS

Disco /dev/sdb: 500,1 GB, 500107862016 bytes
255 cabezas, 63 sectores/pista, 60801 cilindros
Unidades = cilindros de 16065 * 512 = 8225280 bytes
Identificador de disco: 0xfff7fff7

   Dispositivo Arranque Inicio Bloques finales Sistema de identificación
Nota: el tamaño del sector es 4096 (no 512)

Tenga en cuenta que no se muestra ningún dispositivo en /dev/sdb. Kubuntu no montó automáticamente el disco duro.

Intentar hacer: mount -t ntfs-3g /dev/sda1 /mnt/windowsda como resultado que Mount se queje de quentfs-3g: Failed to access volume '/dev/sda1': No such file or directory

El instalador de Kubuntu tampoco puede determinar qué parte del disco duro utiliza la partición NTFS.

Actualmente estoy ejecutando: smartctl --test=long /dev/sdapero no estoy seguro de lo que significará el resultado

Actualizar:

Esta es la salida dedmraid -ay -vvvv -dddd

ADVERTENCIA: bloqueo /var/lock/dmraid/.lock
ERROR: tamaño de sector 4096 no admitido en /dev/sdc.
AVISO: omitir dispositivo extraíble /dev/sdd      
AVISO: omitir dispositivo extraíble /dev/sde      
AVISO: omitir dispositivo extraíble /dev/sdf      
AVISO: omitir dispositivo extraíble /dev/sdg      
AVISO: /dev/sdh: asr descubriendo           
AVISO: /dev/sdh: ddf1 descubriendo           
AVISO: /dev/sdh: hpt37x descubriendo           
AVISO: /dev/sdh: hpt45x descubriendo           
AVISO: /dev/sdh: isw descubriendo           
DEPURACIÓN: no está en -522494976                    
DEPURACIÓN: estoy intentando codificar el desplazamiento -2115.
DEPURACIÓN: no está en -523576832
AVISO: /dev/sdh: jmicron descubriendo
AVISO: /dev/sdh: lsi descubriendo
AVISO: /dev/sdh: nvidia descubriendo
AVISO: /dev/sdh: descubrimiento de pdc
AVISO: /dev/sdh: sil descubriendo
AVISO: /dev/sdh: mediante descubrimiento
AVISO: /dev/sdb: asr descubriendo
AVISO: /dev/sdb: ddf1 descubriendo
AVISO: /dev/sdb: hpt37x descubriendo
AVISO: /dev/sdb: hpt45x descubriendo
AVISO: /dev/sdb: isw descubriendo
DEPURACIÓN: no está en 1891654656
DEPURACIÓN: estoy intentando codificar el desplazamiento -2115.
DEPURACIÓN: no está en 1890572800
AVISO: /dev/sdb: jmicron descubriendo
AVISO: /dev/sdb: lsi descubriendo
AVISO: /dev/sdb: nvidia descubriendo
AVISO: /dev/sdb: metadatos de nvidia descubiertos
AVISO: /dev/sdb: descubrimiento de pdc
AVISO: /dev/sdb: sil descubriendo
AVISO: /dev/sdb: mediante descubrimiento
AVISO: /dev/sda: asr descubriendo
AVISO: /dev/sda: ddf1 descubriendo
AVISO: /dev/sda: hpt37x descubriendo
AVISO: /dev/sda: hpt45x descubriendo
AVISO: /dev/sda: isw descubriendo
DEPURACIÓN: no está en 1891654656
DEPURACIÓN: estoy intentando codificar el desplazamiento -2115.
DEPURACIÓN: no está en 1890572800
AVISO: /dev/sda: jmicron descubriendo
AVISO: /dev/sda: lsi descubriendo
AVISO: /dev/sda: nvidia descubriendo
AVISO: /dev/sda: metadatos de nvidia descubiertos
AVISO: /dev/sda: descubrimiento de pdc
AVISO: /dev/sda: sil descubriendo
AVISO: /dev/sda: mediante descubrimiento
DEPURACIÓN: _find_set: buscando nvidia_ijdbffag
DEPURACIÓN: _find_set: no encontrado nvidia_ijdbffag
DEPURACIÓN: _find_set: buscando nvidia_ijdbffag
DEPURACIÓN: _find_set: no encontrado nvidia_ijdbffag
AVISO: se agregó /dev/sdb al conjunto RAID "nvidia_ijdbffag"
DEBUG: _find_set: buscando nvidia_dacifgcg
DEBUG: _find_set: buscando nvidia_dacifgcg
DEPURACIÓN: _find_set: no encontrado nvidia_dacifgcg
DEPURACIÓN: _find_set: no encontrado nvidia_dacifgcg
DEBUG: _find_set: buscando nvidia_dacifgcg
DEPURACIÓN: _find_set: no encontrado nvidia_dacifgcg
AVISO: se agregó /dev/sda al conjunto RAID "nvidia_dacifgcg"
DEPURACIÓN: comprobando el dispositivo nvidia "/dev/sdb"
DEPURACIÓN: establezca el estado del conjunto "nvidia_ijdbffag" en 16
DEPURACIÓN: comprobando el dispositivo nvidia "/dev/sda"
DEPURACIÓN: establezca el estado del conjunto "nvidia_dacifgcg" en 16
El conjunto RAID "nvidia_ijdbffag" ya está activo
INFORMACIÓN: Activando el conjunto de incursiones lineales "nvidia_ijdbffag"
El conjunto RAID "nvidia_dacifgcg" ya está activo
INFORMACIÓN: Activando el conjunto de incursiones lineales "nvidia_dacifgcg"
AVISO: descubrir particiones en "nvidia_ijdbffag"
AVISO: /dev/mapper/nvidia_ijdbffag: dos descubriendo
AVISO: /dev/mapper/nvidia_ijdbffag: dos metadatos descubiertos
AVISO: se crearon conjuntos RAID particionados para /dev/mapper/nvidia_ijdbffag
AVISO: descubrir particiones en "nvidia_dacifgcg"
AVISO: /dev/mapper/nvidia_dacifgcg: dos descubriendo
AVISO: /dev/mapper/nvidia_dacifgcg: dos metadatos descubiertos
DEPURACIÓN: _find_set: buscando nvidia_dacifgcg1
DEPURACIÓN: _find_set: no encontrado nvidia_dacifgcg1
AVISO: se crearon conjuntos RAID particionados para /dev/mapper/nvidia_dacifgcg
El conjunto RAID "nvidia_dacifgcg1" ya está activo
INFORMACIÓN: Activando el conjunto de raid de partición "nvidia_dacifgcg1"
ADVERTENCIA: desbloqueo /var/lock/dmraid/.lock
DEBUG: liberación de dispositivos del conjunto RAID "nvidia_ijdbffag"
DEBUG: liberando dispositivo "nvidia_ijdbffag", ruta "/dev/sdb"
DEBUG: liberación de dispositivos del conjunto RAID "nvidia_dacifgcg"
DEBUG: liberando dispositivo "nvidia_dacifgcg", ruta "/dev/sda"
DEBUG: liberación de dispositivos del conjunto RAID "nvidia_dacifgcg1"
DEBUG: liberando el dispositivo "nvidia_dacifgcg1", ruta "/dev/mapper/nvidia_dacifgcg"

Esta es la salida dedmraid -r

/dev/sdb: nvidia, "nvidia_ijdbffag", lineal, ok, 976773166 sectores, datos @ 0
/dev/sda: nvidia, "nvidia_dacifgcg", lineal, ok, 976773166 sectores, datos @ 0

Esta es la salida desmartctl -a /dev/sda

smartctl versión 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
La página de inicio es http://smartmontools.sourceforge.net/                        

Dispositivo abierto Smartctl: /dev/sda1 falló: no existe tal archivo o directorio
root@ubuntu:~# smartctl --todos /dev/sda
smartctl versión 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
La página de inicio es http://smartmontools.sourceforge.net/                        

=== INICIO DE LA SECCIÓN DE INFORMACIÓN ===
Familia de modelos: Hitachi Deskstar T7K500
Modelo de dispositivo: Hitachi HDT725050VLA360
Número de serie: VFK401R424LAJK         
Versión de firmware: V56OA7EA               
Capacidad de usuario: 500.107.862.016 bytes  
El dispositivo está: En la base de datos smartctl [para más detalles use: -P show]
La versión ATA es: 7                                              
El estándar ATA es: ATA/ATAPI-7 T13 1532D revisión 1               
La hora local es: martes 2 de noviembre 02:39:57 2010 UTC                   
La compatibilidad con SMART está: Disponible: el dispositivo tiene capacidad SMART.
El soporte SMART está: Habilitado

=== INICIO DE LA SECCIÓN DE LEER DATOS INTELIGENTES ===
Resultado de la prueba SMART de autoevaluación de salud general: ¡FALLÓ!
Se espera una falla en la unidad en menos de 24 horas. GUARDAR TODOS LOS DATOS.
Consulte la lista de atributos específicos del proveedor para conocer los atributos fallidos.

Valores SMART generales:
Estado de recopilación de datos sin conexión: (0x00) Actividad de recopilación de datos sin conexión
                                        nunca se inició.
                                        Recopilación automática de datos sin conexión: deshabilitada.
Estado de ejecución de la autoprueba: (117) La autoprueba anterior se completó habiendo
                                        el elemento de lectura de la prueba falló.
Tiempo total para completar sin conexión
recopilación de datos: (8389) segundos.
Recopilación de datos sin conexión
Capacidades: (0x5b) Ejecución SMART sin conexión inmediata.
                                        Compatibilidad con activación/desactivación de la recopilación automática de datos sin conexión.
                                        Suspender la colección sin conexión al recibir nueva
                                        dominio.
                                        Se admite escaneo de superficie sin conexión.
                                        Compatible con autoprueba.
                                        No se admite la autoprueba de transporte.
                                        Se admite la autoprueba selectiva.
Capacidades SMART: (0x0003) Guarda los datos SMART antes de ingresar
                                        modo de ahorro de energía.
                                        Admite el temporizador de guardado automático SMART.
Capacidad de registro de errores: (0x01) Se admite el registro de errores.
                                        Se admite el registro de propósito general.
Breve rutina de autoevaluación
Tiempo de votación recomendado: (1) minutos.
Rutina de autoprueba extendida
Tiempo de votación recomendado: (140) minutos.
Capacidades de SCT: (0x003f) Estado de SCT compatible.
                                        Compatible con el control de funciones SCT.
                                        Se admite la tabla de datos SCT.

Número de revisión de la estructura de datos de atributos SMART: 16
Atributos SMART específicos del proveedor con umbrales:
ID# ATTRIBUTE_NAME VALOR DE INDICADOR PEOR TIPO UMBRAL ACTUALIZADO CUANDO_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000b 097 097 016 Pre-fallo Siempre - 196612
  2 Throughput_Performance 0x0005 100 100 050 Pre-fallo Sin conexión - 0
  3 Spin_Up_Time 0x0007 137 137 024 Pre-fallo Siempre - 287 (Promedio 441)
  4 Start_Stop_Count 0x0012 100 100 000 Old_age Siempre - 1086
  5 Reasignado_Sector_Ct 0x0033 001 001 005 Pre-fallo Siempre FAILING_NOW 1885
  7 Seek_Error_Rate 0x000b 099 099 067 Pre-fallo Siempre - 1
  8 Seek_Time_Performance 0x0005 100 100 020 Pre-fallo Sin conexión - 0
  9 Power_On_Hours 0x0012 099 099 000 Old_age Siempre - 12937
 10 Spin_Retry_Count 0x0013 100 100 060 Pre-fallo Siempre - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Siempre - 1075
192 Power-Off_Retract_Count 0x0032 099 099 000 Old_age Siempre - 1797
193 Load_Cycle_Count 0x0012 099 099 000 Old_age Siempre - 1797
194 Temperature_Celsius 0x0002 187 187 000 Old_age Siempre - 32 (Vida útil mín./máx. 18/43)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Siempre - 2120
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Siempre - 2
198 Desconectado_Incorregible 0x0008 100 100 000 Old_age Desconectado - 0
199 UDMA_CRC_Error_Count 0x000a 200 253 000 Old_age Siempre - 0

Versión del registro de errores SMART: 1
No se registraron errores

Revisión número 1 de la estructura del registro de autoprueba SMART
Núm. Prueba_Descripción Estado Vida útil restante (horas) LBA_of_first_error
# 1 Extendido fuera de línea Completado: error de lectura 50% 12937 621063894

Revisión número 1 de la estructura de datos del registro de autoprueba selectiva SMART
 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
    1 0 0 No_probando
    2 0 0 No_prueba
    3 0 0 No_prueba
    4 0 0 No_prueba
    5 0 0 No_prueba
Indicadores de autoprueba selectiva (0x0):
  Después de escanear tramos seleccionados, NO lea el resto del disco.
Si la autoprueba selectiva está pendiente al encender, reanude después de un retraso de 0 minutos.

Esta es la salida de smartctl -a /dev/sdb

smartctl versión 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
La página de inicio es http://smartmontools.sourceforge.net/                        

=== INICIO DE LA SECCIÓN DE INFORMACIÓN ===
Modelo de dispositivo: Hitachi HDP725050GLA360
Número de serie: GEB531RE00M21B         
Versión de firmware: GM4OA50E               
Capacidad de usuario: 500.107.862.016 bytes  
El dispositivo está: No en la base de datos smartctl [para más detalles use: -P showall]
La versión ATA es: 8                                                     
El estándar ATA es: ATA-8-ACS revisión 4                                  
La hora local es: martes 2 de noviembre 02:41:11 2010 UTC
La compatibilidad con SMART está: Disponible: el dispositivo tiene capacidad SMART.
El soporte SMART está: Habilitado

=== INICIO DE LA SECCIÓN DE LEER DATOS INTELIGENTES ===
Resultado de la prueba de autoevaluación de salud general SMART: APROBADO

Valores SMART generales:
Estado de recopilación de datos sin conexión: (0x80) Actividad de recopilación de datos sin conexión
                                        nunca se inició.
                                        Recopilación automática de datos sin conexión: habilitada.
Estado de ejecución de la autoprueba: (0) La rutina de autoprueba anterior se completó
                                        sin error o sin autocomprobación alguna vez
                                        sido ejecutado.
Tiempo total para completar sin conexión
recopilación de datos: (7854) segundos.
Recopilación de datos sin conexión
Capacidades: (0x5b) Ejecución SMART sin conexión inmediata.
                                        Compatibilidad con activación/desactivación de la recopilación automática de datos sin conexión.
                                        Suspender la colección sin conexión al recibir nueva
                                        dominio.
                                        Se admite escaneo de superficie sin conexión.
                                        Compatible con autoprueba.
                                        No se admite la autoprueba de transporte.
                                        Se admite la autoprueba selectiva.
Capacidades SMART: (0x0003) Guarda los datos SMART antes de ingresar
                                        modo de ahorro de energía.
                                        Admite el temporizador de guardado automático SMART.
Capacidad de registro de errores: (0x01) Se admite el registro de errores.
                                        Se admite el registro de propósito general.
Breve rutina de autoevaluación
Tiempo de votación recomendado: (1) minutos.
Rutina de autoprueba extendida
Tiempo de votación recomendado: (131) minutos.
Capacidades de SCT: (0x003d) Estado de SCT compatible.
                                        Compatible con el control de funciones SCT.
                                        Se admite la tabla de datos SCT.

Número de revisión de la estructura de datos de atributos SMART: 16
Atributos SMART específicos del proveedor con umbrales:
ID# ATTRIBUTE_NAME VALOR DE INDICADOR PEOR TIPO UMBRAL ACTUALIZADO CUANDO_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-fallo Siempre - 0
  2 Throughput_Performance 0x0005 131 131 054 Pre-fallo sin conexión - 147
  3 Spin_Up_Time 0x0007 161 161 024 Pre-fallo Siempre - 222 (Promedio 256)
  4 Start_Stop_Count 0x0012 100 100 000 Old_age Siempre - 1011
  5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fallo Siempre - 0
  7 Seek_Error_Rate 0x000b 100 100 067 Pre-fallo Siempre - 0
  8 Seek_Time_Performance 0x0005 131 131 020 Pre-fallo Sin conexión - 29
  9 Power_On_Hours 0x0012 099 099 000 Old_age Siempre - 12930
 10 Spin_Retry_Count 0x0013 100 100 060 Pre-fallo Siempre - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Siempre - 1008
192 Power-Off_Retract_Count 0x0032 099 099 000 Old_age Siempre - 1747
193 Load_Cycle_Count 0x0012 099 099 000 Old_age Siempre - 1747
194 Temperature_Celsius 0x0002 214 214 000 Old_age Siempre - 28 (Vida útil mín./máx. 17/39)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Siempre - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Siempre - 0
198 Desconectado_Incorregible 0x0008 100 100 000 Old_age Desconectado - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Siempre - 0

Versión del registro de errores SMART: 1
No se registraron errores

Revisión número 1 de la estructura del registro de autoprueba SMART
No se han registrado autopruebas. [Para ejecutar autopruebas, utilice: smartctl -t]


Revisión número 1 de la estructura de datos del registro de autoprueba selectiva SMART
 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
    1 0 0 No_probando
    2 0 0 No_prueba
    3 0 0 No_prueba
    4 0 0 No_prueba
    5 0 0 No_prueba
Indicadores de autoprueba selectiva (0x0):
  Después de escanear tramos seleccionados, NO lea el resto del disco.
Si la autoprueba selectiva está pendiente al encender, reanude después de un retraso de 0 minutos.

Respuesta1

Poder casi iniciar sesión en Windows XP no suena como una unidad fallida en un raid0. Cuando he visto matrices raid0 fallidas, no hay arranque (hardware).

Para el liveCD de Kubuntu, no se carga el controlador (módulo) adecuado para raid0 y Kubuntu está intentando leer sda y sdb como unidades separadas. Sda está "funcionando" porque tiene un MBR y sdb falla porque no lo tiene. No puede montar /dev/sda1 ya que la mitad de los datos de su volumen NTFS están en sdb, que no se está leyendo.

¿Cómo se está haciendo el Raid0? (software o hardware)

Respuesta2

Ejecute un chkdsk en la matriz, inserte el controlador sata en un CD de instalación de XP, luego inicie en recuperación y ejecute chkdsk /r desde el símbolo del sistema.

Utilizo esto para integrar los "controladores de almacenamiento masivo" en un CD de XP, sin necesidad de los otros paquetes de controladores que ofrecen en su caso.

http://driverpacks.net/about

Cómo utilizar la herramienta DPsBASE http://users.telenet.be/jtdoom/basetute/Eng_tut6b.htm

.

Respuesta3

Es evidente que una de las unidades está fallando. No puedes montar solo una de las unidades ya que solo contiene parte de los datos; tienes que montar toda la matriz, que es /dev/mapper/nvidia_ijdbffag1.

Respuesta4

Su unidad /dev/sda está fallando. Ya 1.885 sectores reasignados son una clara señal de un impulso moribundo. Verifique también el estado de /dev/sdb.

Duplica tu disco usando ddrescue para evitar una mayor degradación. Tenga en cuenta que duplicar la unidad probablemente deteriorará aún más su estado. Puede que también sea necesario duplicar /dev/sdb. Con el diseño rayado de una matriz RAID0, necesita dos unidades que funcionen para la recuperación de datos.


Número de revisión de la estructura de datos de atributos SMART: 16 Atributos SMART específicos del proveedor con umbrales: ID# NOMBRE_ATRIBUTO VALOR DE BANDERA PEOR TIPO DE UMBRAL ACTUALIZADO CUANDO_FAILED VALOR_RAW 1 Tasa_de_error_lectura_sin_bruta 0x000b 097 097 016 Pre-fallo Siempre - 196612

5 Reasignado_Sector_Ct 0x0033 001 001 005 Pre-fallo Siempre FAILING_NOW1885

196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Siempre - 2120

197 Current_Pending_Sector 0x0022 100 100 000 Old_age Siempre - 2

información relacionada