Como detectar um possível erro de hardware?

Como detectar um possível erro de hardware?

Estou executando o Debian Wheezy em um laptop HP Pavilion dv7 e ele congela de vez em quando, exigindo uma reinicialização. Uma vez ele nem carregou o sistema operacional, mas não fui eu quem o estava usando, então não sei dizer qual erro foi exibido. Em uma instalação anterior do Windows 7, ele falhava constantemente ao carregar o Windows, jogando o usuário na tela de "tentativa de reparos", que fazia algo por alguns minutos e depois dizia que o Windows não conseguiu resolver o problema.

Isso me leva a pensar que há um problema de hardware, e eu queria saber se há algo em /var/logou em outro lugar que possa fornecer alguma informação sobre o que está acontecendo, ou se há algum teste que eu possa executar e o que devo procurar.

eu emiti

grep -i "error" /var/log

A saída completa éaqui. A única frase que consegui entender e que acho que pode ter algo a ver com o problema foi

/var/log/dmesg.0:[   11.632723] [drm:radeon_pci_probe] *ERROR* radeon kernel modesetting for R600 or later requires firmware-linux-nonfree.

Mas

lspci | grep -i vga

Devoluções

00:02.0 VGA compatible controller: Intel Corporation 2nd Generation Core Processor Family Integrated Graphics Controller (rev 09)
01:00.0 VGA compatible controller: Advanced Micro Devices [AMD] nee ATI Whistler XT [AMD Radeon HD 6700M Series]

E System > System Settings > Details > Graphicsshows Intel(R) Sandybridge Mobileestão sendo usados. Então acho que o erro foi "resolvido" usando a placa gráfica integrada?

Também tinha

/var/log/syslog.1:Apr 19 20:14:09 magui kernel: [    1.087417]  pci0000:00: ACPI _OSC request failed (AE_ERROR), returned control mask: 0x1d
/var/log/syslog.1:Apr 19 20:14:09 magui kernel: [    8.510757] ata1.00: irq_stat 0x08000000, interface fatal error
/var/log/syslog.1:Apr 19 20:14:09 magui kernel: [    8.510810] ata1: SError: { UnrecovData 10B8B BadCRC }
/var/log/syslog.1:Apr 19 20:14:09 magui kernel: [    8.510914]          res 40/00:08:00:76:14/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
/var/log/syslog.1:Apr 19 20:14:09 magui kernel: [    8.511121]          res 40/00:08:00:76:14/00:00:00:00:00/40 Emask 0x10 (ATA bus error)

Mas não tenho ideia do que isso significa, então estou meio perdido aqui. O que devo procurar?

Responder1

Execute smartctl -a /dev/sdaou qualquer que seja o seu disco. Em seguida, observe a taxa de erro de leitura e procure as linhas de taxa de erro. Se um desses valores for alto, seu disco provavelmente está morto.

Responder2

Parece que você tem um disco, controlador ou cabo com defeito. O log completo do kernel em torno disso seria útil, em vez de apenas linhas que contêm a palavra "erro".

informação relacionada