Diagnosticando falha do Windows/HDD/RAID0

Diagnosticando falha do Windows/HDD/RAID0

Minha máquina é a seguinte:

  • Par de discos rígidos em RAID0, ATA Hitachi HDT72505
  • Placa-mãe nVidia, "M51"?

O Windows XP recusou-se a inicializar:

  • A inicialização normalmente resulta em travamento durante a tela de carregamento do Windows
  • Inicializando em modo de segurança, é possível acessar a tela de login. O login resulta em suspensão.

Usando o CD de instalação do Windows XP:

  • Não detecta nenhum dos discos rígidos
  • Se um HD externo estiver conectado, o CD montará esse HD enquanto estiver usando o Console de Recuperação

Felizmente, tenho um DVD do Kubuntu 9.10.

fdisk -lmostra esta saída:

Disco /dev/sda: 500,1 GB, 500107862016 bytes
255 cabeçotes, 63 setores/pista, 60.801 cilindros
Unidades = cilindros de 16065 * 512 = 8225280 bytes
Identificador de disco: 0xc0cfc0cf

   Sistema de identificação de blocos de início de inicialização do dispositivo
/dev/sda1 * 1 60801 488384001 7 HPFS/NTFS

Disco /dev/sdb: 500,1 GB, 500107862016 bytes
255 cabeçotes, 63 setores/pista, 60.801 cilindros
Unidades = cilindros de 16065 * 512 = 8225280 bytes
Identificador de disco: 0xfff7fff7

   Sistema de identificação de blocos de início de inicialização do dispositivo
Nota: o tamanho do setor é 4.096 (não 512)

Observe que não há nenhum dispositivo mostrado em /dev/sdb. O Kubuntu não montou automaticamente o disco rígido.

Tentando fazer: mount -t ntfs-3g /dev/sda1 /mnt/windowsresulta em montar reclamando quentfs-3g: Failed to access volume '/dev/sda1': No such file or directory

O instalador do Kubuntu também não pode determinar quanto do disco rígido é usado pela partição NTFS.

Atualmente estou executando: smartctl --test=long /dev/sdamas não tenho certeza do que o resultado significará

Atualizar:

Esta é a saída dedmraid -ay -vvvv -dddd

AVISO: bloqueando /var/lock/dmraid/.lock
ERRO: tamanho de setor não suportado 4096 em/dev/sdc.
AVISO: ignorando dispositivo removível /dev/sdd      
AVISO: ignorando dispositivo removível /dev/sde      
AVISO: ignorando dispositivo removível /dev/sdf      
AVISO: ignorando dispositivo removível /dev/sdg      
AVISO: /dev/sdh: descoberta de asr           
AVISO: /dev/sdh: descoberta de ddf1           
AVISO: /dev/sdh: descoberta do hpt37x           
AVISO: /dev/sdh: descoberta do hpt45x           
AVISO: /dev/sdh: isw descobrindo           
DEBUG: não está em -522494976                    
DEBUG: estou tentando o deslocamento -2115 codificado.
DEBUG: não está em -523576832
AVISO: /dev/sdh: descoberta de jmicron
AVISO: /dev/sdh: lsi descobrindo
AVISO: /dev/sdh: descoberta da nvidia
AVISO: /dev/sdh: descoberta de pdc
AVISO: /dev/sdh: sil descobrindo
AVISO: /dev/sdh: via descoberta
AVISO: /dev/sdb: descoberta de asr
AVISO: /dev/sdb: descoberta de ddf1
AVISO: /dev/sdb: descoberta do hpt37x
AVISO: /dev/sdb: descoberta do hpt45x
AVISO: /dev/sdb: isw descobrindo
DEBUG: não isw em 1891654656
DEBUG: estou tentando o deslocamento -2115 codificado.
DEBUG: não isw em 1890572800
AVISO: /dev/sdb: descoberta de jmicron
AVISO: /dev/sdb: lsi descobrindo
AVISO: /dev/sdb: descoberta da nvidia
AVISO: /dev/sdb: metadados da nvidia descobertos
AVISO: /dev/sdb: descoberta de pdc
AVISO: /dev/sdb: sil descobrindo
AVISO: /dev/sdb: via descoberta
AVISO: /dev/sda: descoberta de asr
AVISO: /dev/sda: descoberta de ddf1
AVISO: /dev/sda: descoberta do hpt37x
AVISO: /dev/sda: descoberta do hpt45x
AVISO: /dev/sda: está descobrindo
DEBUG: não isw em 1891654656
DEBUG: estou tentando o deslocamento -2115 codificado.
DEBUG: não isw em 1890572800
AVISO: /dev/sda: descoberta de jmicron
AVISO: /dev/sda: lsi descobrindo
AVISO: /dev/sda: descoberta da nvidia
AVISO: /dev/sda: metadados da nvidia descobertos
AVISO: /dev/sda: descoberta de pdc
AVISO: /dev/sda: sil descobrindo
AVISO: /dev/sda: via descoberta
DEBUG: _find_set: pesquisando nvidia_ijdbffag
DEBUG: _find_set: não encontrado nvidia_ijdbffag
DEBUG: _find_set: pesquisando nvidia_ijdbffag
DEBUG: _find_set: não encontrado nvidia_ijdbffag
AVISO: adicionado /dev/sdb ao conjunto RAID "nvidia_ijdbffag"
DEBUG: _find_set: pesquisando nvidia_dacifgcg
DEBUG: _find_set: pesquisando nvidia_dacifgcg
DEBUG: _find_set: não encontrado nvidia_dacifgcg
DEBUG: _find_set: não encontrado nvidia_dacifgcg
DEBUG: _find_set: pesquisando nvidia_dacifgcg
DEBUG: _find_set: não encontrado nvidia_dacifgcg
AVISO: adicionado /dev/sda ao conjunto RAID "nvidia_dacifgcg"
DEBUG: verificando o dispositivo nvidia "/dev/sdb"
DEBUG: defina o status do conjunto "nvidia_ijdbffag" para 16
DEBUG: verificando o dispositivo nvidia "/dev/sda"
DEBUG: defina o status do conjunto "nvidia_dacifgcg" para 16
Conjunto RAID "nvidia_ijdbffag" já ativo
INFO: Ativando o conjunto de ataque linear "nvidia_ijdbffag"
Conjunto RAID “nvidia_dacifgcg” já ativo
INFO: Ativando conjunto de ataque linear "nvidia_dacifgcg"
AVISO: descobrindo partições em "nvidia_ijdbffag"
AVISO: /dev/mapper/nvidia_ijdbffag: dos descobrindo
AVISO: /dev/mapper/nvidia_ijdbffag: dos metadados descobertos
AVISO: foram criados conjuntos RAID particionados para /dev/mapper/nvidia_ijdbffag
AVISO: descobrindo partições em "nvidia_dacifgcg"
AVISO: /dev/mapper/nvidia_dacifgcg: dos descobrindo
AVISO: /dev/mapper/nvidia_dacifgcg: dos metadados descobertos
DEBUG: _find_set: pesquisando nvidia_dacifgcg1
DEBUG: _find_set: não encontrado nvidia_dacifgcg1
AVISO: foram criados conjuntos RAID particionados para /dev/mapper/nvidia_dacifgcg
Conjunto RAID "nvidia_dacifgcg1" já ativo
INFO: Ativando o conjunto de raid de partição "nvidia_dacifgcg1"
AVISO: desbloqueando /var/lock/dmraid/.lock
DEBUG: liberando dispositivos do conjunto RAID "nvidia_ijdbffag"
DEBUG: liberando dispositivo "nvidia_ijdbffag", caminho "/dev/sdb"
DEBUG: liberando dispositivos do conjunto RAID "nvidia_dacifgcg"
DEBUG: liberando dispositivo "nvidia_dacifgcg", caminho "/dev/sda"
DEBUG: liberando dispositivos do conjunto RAID "nvidia_dacifgcg1"
DEBUG: liberando dispositivo "nvidia_dacifgcg1", caminho "/dev/mapper/nvidia_dacifgcg"

Esta é a saída dedmraid -r

/dev/sdb: nvidia, "nvidia_ijdbffag", linear, ok, 976773166 setores, dados@ 0
/dev/sda: nvidia, "nvidia_dacifgcg", linear, ok, 976773166 setores, dados@ 0

Esta é a saída desmartctl -a /dev/sda

smartctl versão 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
A página inicial é http://smartmontools.sourceforge.net/                        

Dispositivo aberto Smartctl: /dev/sda1 falhou: arquivo ou diretório inexistente
root@ubuntu:~# smartctl --all /dev/sda
smartctl versão 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
A página inicial é http://smartmontools.sourceforge.net/                        

=== INÍCIO DA SEÇÃO DE INFORMAÇÕES ===
Família de modelos: Hitachi Deskstar T7K500
Modelo do dispositivo: Hitachi HDT725050VLA360
Número de série: VFK401R424LAJK         
Versão do firmware: V56OA7EA               
Capacidade do usuário: 500.107.862.016 bytes  
O dispositivo está: No banco de dados smartctl [para detalhes, use: -P show]
A versão ATA é: 7                                              
O padrão ATA é: ATA/ATAPI-7 T13 1532D revisão 1               
A hora local é: terça-feira, 2 de novembro 02:39:57 2010 UTC                   
O suporte SMART é: Disponível - o dispositivo possui capacidade SMART.
O suporte SMART está: Ativado

=== INÍCIO DA LEITURA DA SEÇÃO DE DADOS INTELIGENTES ===
Resultado do teste de autoavaliação de saúde geral SMART: FALHOU!
Falha na unidade esperada em menos de 24 horas. SALVE TODOS OS DADOS.
Consulte a lista de atributos específicos do fornecedor para atributos com falha.

Valores gerais SMART:
Status de coleta de dados offline: (0x00) Atividade de coleta de dados offline
                                        nunca foi iniciado.
                                        Coleta automática de dados off-line: Desativada.
Status de execução do autoteste: (117) O autoteste anterior foi concluído tendo
                                        o elemento de leitura do teste falhou.
Tempo total para concluir off-line
coleta de dados: (8389) segundos.
Coleta de dados off-line
capacidades: (0x5b) SMART executa offline imediatamente.
                                        Suporte para ativação/desativação da coleta de dados off-line automática.
                                        Suspender coleta off-line em caso de novo
                                        comando.
                                        Varredura de superfície offline suportada.
                                        Autoteste suportado.
                                        Não há suporte para autoteste de transporte.
                                        Autoteste seletivo suportado.
Capacidades SMART: (0x0003) Salva dados SMART antes de entrar
                                        modo de economia de energia.
                                        Suporta temporizador de salvamento automático SMART.
Capacidade de registro de erros: (0x01) Registro de erros suportado.
                                        Registro de uso geral suportado.
Rotina curta de autoteste
tempo de votação recomendado: (1) minutos.
Rotina de autoteste estendida
tempo de votação recomendado: (140) minutos.
Capacidades SCT: (0x003f) Status SCT suportado.
                                        Controle de recurso SCT suportado.
                                        Tabela de dados SCT suportada.

Número de revisão da estrutura de dados de atributos SMART: 16
Atributos SMART específicos do fornecedor com limites:
ID# ATTRIBUTE_NAME FLAG VALUE PIOR TIPO DE LIMITE ATUALIZADO WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000b 097 097 016 Pré-falha Sempre - 196612
  2 Throughput_Performance 0x0005 100 100 050 Pré-falha offline - 0
  3 Spin_Up_Time 0x0007 137 137 024 Pré-falha Sempre - 287 (Média 441)
  4 Start_Stop_Count 0x0012 100 100 000 Velhice Sempre - 1086
  5 Reallocated_Sector_Ct 0x0033 001 001 005 Pré-falha Sempre FAILING_NOW 1885
  7 Seek_Error_Rate 0x000b 099 099 067 Pré-falha Sempre - 1
  8 Seek_Time_Performance 0x0005 100 100 020 Pré-falha offline - 0
  9 Power_On_Hours 0x0012 099 099 000 Old_age Sempre - 12937
 10 Spin_Retry_Count 0x0013 100 100 060 Pré-falha Sempre - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Velhice Sempre - 1075
192 Power-Off_Retract_Count 0x0032 099 099 000 Old_age Sempre - 1797
193 Load_Cycle_Count 0x0012 099 099 000 Old_age Sempre - 1797
194 Temperature_Celsius 0x0002 187 187 000 Old_age Sempre - 32 (Vida Mín/Máx 18/43)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Sempre - 2120
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Sempre - 2
198 Offline_Incorrigível 0x0008 100 100 000 Velhice Offline - 0
199 UDMA_CRC_Error_Count 0x000a 200 253 000 Old_age Sempre - 0

Versão do registro de erros SMART: 1
Nenhum erro registrado

Revisão número 1 da estrutura de log do autoteste SMART
Num Test_Description Status Tempo de vida restante (horas) LBA_of_first_error
# 1 Offline estendido concluído: falha de leitura 50% 12937 621063894

Revisão número 1 da estrutura de dados do registro de autoteste seletivo SMART
 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
    1 0 0 Não_testando
    2 0 0 Não_testando
    3 0 0 Não_testando
    4 0 0 Não_testando
    5 0 0 Não_testando
Sinalizadores de autoteste seletivo (0x0):
  Depois de verificar os trechos selecionados, NÃO leia o restante do disco.
Se o autoteste seletivo estiver pendente na inicialização, retome após 0 minutos de atraso.

Esta é a saída de smartctl -a /dev/sdb

smartctl versão 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
A página inicial é http://smartmontools.sourceforge.net/                        

=== INÍCIO DA SEÇÃO DE INFORMAÇÕES ===
Modelo do dispositivo: Hitachi HDP725050GLA360
Número de série: GEB531RE00M21B         
Versão do firmware: GM4OA50E               
Capacidade do usuário: 500.107.862.016 bytes  
O dispositivo está: Não está no banco de dados smartctl [para detalhes, use: -P showall]
A versão ATA é: 8                                                     
O padrão ATA é: ATA-8-ACS revisão 4                                  
A hora local é: terça-feira, 2 de novembro 02:41:11 2010 UTC
O suporte SMART é: Disponível - o dispositivo possui capacidade SMART.
O suporte SMART está: Ativado

=== INÍCIO DA LEITURA DA SEÇÃO DE DADOS INTELIGENTES ===
Resultado do teste de autoavaliação de saúde geral SMART: APROVADO

Valores gerais SMART:
Status de coleta de dados offline: (0x80) Atividade de coleta de dados offline
                                        nunca foi iniciado.
                                        Coleta automática de dados off-line: habilitada.
Status de execução do autoteste: (0) A rotina de autoteste anterior foi concluída
                                        sem erros ou sem autoteste
                                        foi executado.
Tempo total para concluir off-line
coleta de dados: (7854) segundos.
Coleta de dados off-line
capacidades: (0x5b) SMART executa offline imediatamente.
                                        Suporte para ativação/desativação da coleta de dados off-line automática.
                                        Suspender coleta off-line em caso de novo
                                        comando.
                                        Varredura de superfície offline suportada.
                                        Autoteste suportado.
                                        Não há suporte para autoteste de transporte.
                                        Autoteste seletivo suportado.
Capacidades SMART: (0x0003) Salva dados SMART antes de entrar
                                        modo de economia de energia.
                                        Suporta temporizador de salvamento automático SMART.
Capacidade de registro de erros: (0x01) Registro de erros suportado.
                                        Registro de uso geral suportado.
Rotina curta de autoteste
tempo de votação recomendado: (1) minutos.
Rotina de autoteste estendida
tempo de votação recomendado: (131) minutos.
Capacidades SCT: (0x003d) Status SCT suportado.
                                        Controle de recurso SCT suportado.
                                        Tabela de dados SCT suportada.

Número de revisão da estrutura de dados de atributos SMART: 16
Atributos SMART específicos do fornecedor com limites:
ID# ATTRIBUTE_NAME FLAG VALUE PIOR TIPO DE LIMITE ATUALIZADO WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000b 100 100 016 Pré-falha Sempre - 0
  2 Throughput_Performance 0x0005 131 131 054 Pré-falha offline - 147
  3 Spin_Up_Time 0x0007 161 161 024 Pré-falha Sempre - 222 (Média 256)
  4 Start_Stop_Count 0x0012 100 100 000 Old_age Sempre - 1011
  5 Reallocated_Sector_Ct 0x0033 100 100 005 Pré-falha Sempre - 0
  7 Seek_Error_Rate 0x000b 100 100 067 Pré-falha Sempre - 0
  8 Seek_Time_Performance 0x0005 131 131 020 Pré-falha offline - 29
  9 Power_On_Hours 0x0012 099 099 000 Old_age Sempre - 12930
 10 Spin_Retry_Count 0x0013 100 100 060 Pré-falha Sempre - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Velhice Sempre - 1008
192 Power-Off_Retract_Count 0x0032 099 099 000 Old_age Sempre - 1747
193 Load_Cycle_Count 0x0012 099 099 000 Old_age Sempre - 1747
194 Temperature_Celsius 0x0002 214 214 000 Old_age Sempre - 28 (Vida útil Mín/Máx 17/39)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Sempre - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Sempre - 0
198 Offline_Incorrigível 0x0008 100 100 000 Velhice Offline - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Sempre - 0

Versão do registro de erros SMART: 1
Nenhum erro registrado

Revisão número 1 da estrutura de log do autoteste SMART
Nenhum autoteste foi registrado. [Para executar autotestes, use: smartctl -t]


Revisão número 1 da estrutura de dados do registro de autoteste seletivo SMART
 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
    1 0 0 Não_testando
    2 0 0 Não_testando
    3 0 0 Não_testando
    4 0 0 Não_testando
    5 0 0 Não_testando
Sinalizadores de autoteste seletivo (0x0):
  Depois de verificar os trechos selecionados, NÃO leia o restante do disco.
Se o autoteste seletivo estiver pendente na inicialização, retome após 0 minutos de atraso.

Responder1

Ser capaz de quase fazer login no WindowsXP não parece uma falha na unidade em um raid0. Quando vejo arrays raid0 com falha, não há inicialização (hardware).

Para o liveCD do Kubuntu, o driver (módulo) adequado não está sendo carregado para o raid0 e o Kubuntu está tentando ler sda e sdb como unidades separadas. Sda está "funcionando", pois possui um MBR e o sdb está falhando, pois não possui. Você não consegue montar /dev/sda1, pois metade dos dados do seu volume NTFS está no sdb, que não está sendo lido.

Como está sendo feito o Raid0? (software ou hardware)

Responder2

Execute um chkdsk no array, coloque o driver sata em um CD de instalação do XP, inicialize na recuperação e execute chkdsk /r no prompt de comando.

Eu uso isso para integrar os "controladores de armazenamento em massa" em um CD do XP, sem necessidade dos outros pacotes de drivers que eles oferecem no seu caso.

http://driverpacks.net/about

Como usar a ferramenta DPsBASE http://users.telenet.be/jtdoom/basetute/Eng_tut6b.htm

.

Responder3

Claramente uma das unidades está falhando. Você não pode montar apenas uma das unidades, pois ela contém apenas parte dos dados; você precisa montar o array inteiro, que é /dev/mapper/nvidia_ijdbffag1.

Responder4

Sua unidade /dev/sda está falhando. Já os setores realocados em 1885 são um sinal claro de uma unidade em extinção. Verifique a integridade de /dev/sdb também.

Duplique sua unidade usando ddrescue para evitar maior degradação. Esteja ciente de que duplicar a unidade provavelmente deteriorará ainda mais o estado da sua unidade. Pode ser necessário duplicar /dev/sdb também. Com o layout distribuído de uma matriz RAID0, você precisa de duas unidades funcionais para recuperação de dados.


Número de revisão da estrutura de dados de atributos SMART: 16 Atributos SMART específicos do fornecedor com limites: ID # ATTRIBUTE_NAME FLAG VALUE PIOR TIPO DE LIMITE ATUALIZADO WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000b 097 097 016 Pré-falha Sempre - 196612

5 Reallocated_Sector_Ct 0x0033 001 001 005 Pré-falha Sempre FAILING_NOW1885

196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Sempre - 2120

197 Current_Pending_Sector 0x0022 100 100 000 Old_age Sempre - 2

informação relacionada