Portanto, meu Sunfire x2200 M2 possui duas unidades SATA, uma de 250 GB e uma de 2 TB. Em algum momento da noite passada/esta manhã, o sistema foi reinicializado sozinho. Tudo voltou bem, mas depois de revisar alguns logs, descobri o seguinte:http://pastebin.com/Bctbzwb9.
da0
é a unidade de 250 GB, que é a unidade do sistema operacional. Revisei as informações das unidades com smartctl
e tudo parecia bem, porém, ao executar um teste com smartctl
, falhou com um erro de leitura. Então notei isso em var/log/messages
:
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], 7 Currently unreadable (pending) sectors
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], 7 Offline uncorrectable sectors
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], previous self-test completed with error (read test element)
Jan 1 05:20:31 fuzzbox smartd[1160]: Device: /dev/da0 [SAT], Self-Test Log error count increased from 0 to 1
Não tenho certeza do que fazer com isso. Isso parece uma unidade ou controlador com falha?
smartctl -a /dev/da0
saída:http://pastebin.com/RJ6043KJ
Responder1
Parece uma unidade com falha.
Qualquer unidade SATA moderna (e qualquer unidade SCSI antiga) possui somas de verificação em um setor. Se você ler e a soma de verificação não corresponder, ele relerá os dados. Se a releitura dos dados falhar com frequência suficiente, a unidade assumirá que o setor físico do disco está danificado.
Duas coisas podem acontecer se isso ocorrer:
- A unidade fará um esforço para recuperar os dados e, uma vez lido com sucesso, gravará esses dados em um setor sobressalente. Na próxima vez que você tentar ler para o setor original, você será redirecionado para o setor sobressalente. Se isso estiver em andamento, mas não tiver sido concluído com êxito, o status serápendente(assim como no seu log).
- Se isso acontecer com frequência suficiente, a unidade ficará sem setores sobressalentes. Ele não pode mais usar um sobressalente e a leitura resultará em um erro de leitura.
No seu log você tem entradas para currently unreadable (pending) sectors
e 7 Offline uncorrectable sectors
. Isso parece um indicador claro para o caso 1).