DRDY ERR do HDD

DRDY ERR do HDD

De repente, comecei a receber o DRDY ERR com meu laptop rodando Linux..algumas mensagens parecem..

    ata1:00: status: { DRDY ERR }
    ata1.00: error {UNC }
    ata1:00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
    ata1:00: BMDMA stat 0x25
    ata1:00: failed command: READ DMA

finalmente, ele me leva a um prompt de comando pedindo para inserir um nível de execução e depois disso

    INIT: no more processes left in this runlevel

Suspeitando de uma falha no HDD, retirei-o e usei-o em outro PC como uma unidade HDD USB externa e consegui montar e ver todas as partições e arquivos contidos nele. Então presumo que o disco esteja OK.

[EDITAR/ATUALIZAR]

Também consigo inicializar o laptop a partir de um pen drive USB com Linux) e até mesmo ver todas as partições do disco e acessá-las.

Também retirei o HDD e coloquei-o em um gabinete externo e tentei inicializar no mesmo laptop, mas obtive erros diferentes

    end_request: critical target error, dev sda, sector 32839936
    EXT4_fs error: (device sda5): ext4_find_entry:935: inode #393217: comm init: reading directory lblock 0

    INIT: No inittab file found
    Enter runlevel:

Então eu acho que o HDD é acessível como armazenamento, mas não inicializável. O esquema de particionamento nesse HDD está abaixo, se isso ajudar. (Esquema GPT)

    partition   FileSystem  size    flags
    ---------   ----------- ----    -----
    /dev/sda1   unknown     2.00MB  bios_grub
    /dev/sda2   ext2        128MB           # was supposed to be common boot partition for chain loading
    /dev/sda3   swap        1.5GB
    /dev/sda4   ext4        8GB         # Linux 1 (somehow, Grub does not show this in the menu, cannot boot into)
    /dev/sda5   ext4        8GB         # Linux 2 (I could only boot into this one from Grub.)
    /dev/sda6   ext4        94GB        # DATA
    unallocated _           1MB

Eu instalei Linux um após o outro e realmente queria instalar o Grub em /dev/sda2 e carregar o Linux 1 e 2 em cadeia, mas antes que pudesse fazer isso, encontrei esse problema!

Alguma ideia? Soluções?

[ATUALIZAÇÃO 2]

  • O título do problema não é mais aplicável *

Inicializei pelo USB e fiz um 'fsck' em todas as partições. Todos (exceto /sda5) foram reportados como limpos. /dev/sda5 relatou muitos erros (provavelmente cerca de algumas centenas), eu apenas continuei digitando 'y' para todos os prompts. No meio havia mensagens como 'linking 'lost+found' ....' Depois de 2 passagens em todas as partições, quando reiniciei a partir do HDD, aqui está o erro mais recente ...

    INIT: verision 2.88 booting
    INIT: No inittab file file found

    Enter runlevel:

Parece que conseguirei recuperar a instância do sistema operacional e inicializar?

Responder1

O primeiro erro que você relatou:

ata1:00: status: { DRDY ERR }
ata1.00: error {UNC }
ata1:00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
ata1:00: BMDMA stat 0x25
ata1:00: failed command: READ DMA

diz que um READ DMAcomando ATA para um disco na porta ATA 1 falhou (o status inclui ERRparaerro). Essa porta provavelmente é o disco rígido e o erro indica que a unidade está com problemas. A DMAparte provavelmente pode ser ignorada; DMA éAcesso direto à memóriaque é o modo de transferência dominante atualmente, e se você estivesse tendo problemas de RAM ou de barramento de RAM a ponto de acertar algo assim repetidamente, provavelmente veria muito mais erros se o sistema fosse capaz de funcionar. .

O segundo erro:

end_request: critical target error, dev sda, sector 32839936
EXT4_fs error: (device sda5): ext4_find_entry:935: inode #393217: comm init: reading directory lblock 0
INIT: No inittab file found

diz que há algum problema em /dev/sda, setor 32839936, que com setores de 512 bytes nos coloca fisicamente no final da partição /dev/sda5, o que corresponde ao device sda5relatado pelo driver do sistema de arquivos. O erro relatado por initjunto com os detalhes do erro do driver do sistema de arquivos aponta para um problema com o sistema de arquivos, fazendo com que /etc/inittab fique indisponível ou (menos provável) ilegível. Isso significaria que o diretório raiz, o diretório /etc ou a entrada do arquivo /etc/inittab estão de alguma forma envolvidos na corrupção. Dado o número do inode, eu tentaria que /etc/inittab fosse especificamente o culpado, até que se provasse que estava errado.

Você escreve (ênfase minha):

Suspeitando de uma falha no HDD, retirei-o e usei-o em outro PC como uma unidade HDD USB externa e consegui montar e ver todas as partições e arquivos contidos nele.Então presumo que o disco esteja OK.

Eu diria quesua suposição é infundada.O disco está obviamente com algum problema; com alguma sorte, será fácil de consertar.

A primeira coisa que eu fariana sua situação é atualizar meu backup de tudo o que está nesse disco. Certifique-se de não sobrescrever ou excluir nada do seu backup mais recente, pois certamente existe a possibilidade de você precisar dele. Talvez a melhor opção seja fazer um novo backup em uma unidade nova (ou pelo menos não usada anteriormente para seus próprios backups) de tudo o que você consegue acessar. Espere alguns erros de E/S na fonte ao fazer essa cópia.

Segundovem tentando a recuperação. Com alguma sorte, dados os erros, este é um problema de setor único ou de poucos setores que causou uma pequena corrupção no sistema de arquivos; nesse caso,e2fsck deveser capaz de reparar a maior parte dos danos. Alguns de seus arquivos provavelmente desapareceram, mas com alguma sorte, você poderá encontrá-los em /lost+found na raiz de montagem do sistema de arquivos (ou seja, por exemplo /data/lost+found se você montar /dev/sda5 em / data) depois de o e2fsck fazer o que pode. Caso contrário, faça uma comparação com o backup mais recente antes do início dos problemas e restaure os arquivos relevantes do backup. (Eu mencionei que os backups são úteis se coisas ruins acontecerem, como inevitavelmente acontecem?)

Terceirosurge a questão de saber se você pode confiar na unidade para uso futuro. Alguns setores defeituosos não precisam ser catastróficos do ponto de vista da unidade, mas unidades rotacionais com cerca de 100 GB de tamanho praticamente não podem ser adquiridas hoje na maioria dos formatos, o que indica que esta é uma unidade relativamente antiga. Pessoalmente, eu provavelmente aceitaria que a unidade sobreviveu à sua vida útil neste momento e conseguiria uma substituição, mas, novamente, sou bastante paranóico quando se trata de meus dados; sua milhagem pode variar. Voce terá quepesar o custo de uma unidade de substituição contra o risco de falha totalda unidade e subsequenteperda total de todos os dados da unidade.

informação relacionada