¿Está fallando mi disco duro?

¿Está fallando mi disco duro?

Intenté ejecutar una prueba en mi disco duro y no quiere completar una autoprueba. Aquí está el resultado:

smartctl --attributes --log=selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build)

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       697
  3 Spin_Up_Time            0x0027   206   160   021    Pre-fail  Always       -       691
  4 Start_Stop_Count        0x0032   074   074   000    Old_age   Always       -       26734
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       28
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7432
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3186
191 G-Sense_Error_Rate      0x0032   001   001   000    Old_age   Always       -       20473
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       84
193 Load_Cycle_Count        0x0032   051   051   000    Old_age   Always       -       447630
194 Temperature_Celsius     0x0022   113   099   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       16
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%      7432         92290592
# 2  Conveyance offline  Completed: read failure       90%      7432         92290596
# 3  Conveyance offline  Completed: read failure       90%      7432         92290592
# 4  Short offline       Completed: read failure       90%      7431         92290596
# 5  Extended offline    Completed: read failure       90%      7431         92290592

¿Entonces este disco está fallando?

Respuesta1

Su unidad estará encantada de realizar una autoprueba; Según el resumen, ha realizado más de cinco de ellos en la última hora. Y todos ellos fallaron, al principio de la prueba, con errores de lectura.

Sí, este disco duro está fallando. Como decía el famoso informe de Google Labs (aunque no puedo encontrar un enlace en este momento), si smartctldice que su disco está fallando, probablemente así sea (parafraseo).

Editar: no intentes guardarlo. Saque todos los datos y reemplácelos.

Respuesta2

Para responder a su pregunta, una prueba SMART fallida es una indicación segura de una falla inminente en la unidad. Debe hacer una copia de seguridad de sus datos y reemplazar la unidad lo antes posible para evitar una posible pérdida de datos.

@sj0h mencionó el recuento de ciclos de carga, que es muy alto, 447 630. (La mayoría de los discos duros modernos están diseñados para soportar 600.000 ciclos de carga/descarga). Esto suele deberse a la función de administración avanzada de energía (APM), que intenta conservar energía estacionando los cabezales (descargándolos de los platos) después de varios segundos de uso. inactivo. Los cabezales se vuelven a cargar en los platos cuando es necesario. En la mayoría de los sistemas, donde los discos duros tienen una actividad de encendido y apagado intermitente, esto puede provocar que se produzcan muchos ciclos de carga/descarga. Para desactivar APM, ejecute el siguiente comando en el indicador raíz:

smartctl -s apm,off /dev/sda

Este comando deberá ejecutarse cada vez que se reinicie el sistema o se ponga en suspensión o se apague la unidad, ya que esta configuración no se conserva cuando se apaga la unidad.

En mi experiencia, hacer esto reducirá drásticamente la cantidad de ciclos de carga/descarga y, en consecuencia, las posibilidades de que vuelva a experimentar este tipo de falla en el futuro. Sin embargo, tenga en cuenta que hacer esto aumenta el consumo de energía y la temperatura de la unidad. Si la unidad funciona constantemente a temperaturas superiores a 50 °C, el riesgo de falla prematura aumenta, por lo que es posible que desee dejar APM encendido (o encenderlo si está apagado) durante los meses más cálidos.

Respuesta3

Aparte de los fallos de lectura, considere también el recuento de ciclos de carga. En casi 500.000 esto puede indicar una razón de falla, o al menos un desgaste por ciclo de carga alta. Hay un ciclo de carga por cada minuto de tiempo de encendido. Después de reemplazar la unidad, asegúrese de que la nueva unidad no esté haciendo lo mismo.

Respuesta4

Yo personalmente reemplazaría la unidad. Si, por alguna razón, no quiere hacer eso todavía, pero permanece con el disco por un tiempo todavía, necesita alguna forma de asegurarse de no utilizar accidentalmente las áreas defectuosas para archivos nuevos.

Tenía una unidad de este tipo en una vieja Mac que simplemente grababa videos y decidí que no quería cambiarla todavía, ya que era bueno tener los videos. Entonces necesitaba aislar los errores. Primero creé una carpeta vacía solo para archivos incorrectos, y luego intenté leer todos los archivos existentes en el disco y cualquiera de los que tenían un error se movieron al directorio de archivos incorrectos (con suerte, solo los que no son importantes).

Luego creé muchos archivos de un megabyte con nombres únicos para llenar el disco duro (de modo que todo el espacio vacío estaba ahora en uno de estos archivos de 1 MB) y luego repetí el procedimiento. Todos los archivos con errores se movieron al directorio de archivos incorrectos, y los que quedaron eran buenos y podían eliminarse para recuperar el espacio incorrecto.

Ahora puede utilizar el disco un poco más, pero no lo utilice para cosas importantes. Élvoluntadfalla más y lo más probable es que sea un inconveniente cuando suceda.

información relacionada