
Intenté ejecutar una prueba en mi disco duro y no quiere completar una autoprueba. Aquí está el resultado:
smartctl --attributes --log=selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build)
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 697
3 Spin_Up_Time 0x0027 206 160 021 Pre-fail Always - 691
4 Start_Stop_Count 0x0032 074 074 000 Old_age Always - 26734
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 28
9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 7432
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 097 097 000 Old_age Always - 3186
191 G-Sense_Error_Rate 0x0032 001 001 000 Old_age Always - 20473
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 84
193 Load_Cycle_Count 0x0032 051 051 000 Old_age Always - 447630
194 Temperature_Celsius 0x0022 113 099 000 Old_age Always - 34
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 16
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline - 0
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: read failure 90% 7432 92290592
# 2 Conveyance offline Completed: read failure 90% 7432 92290596
# 3 Conveyance offline Completed: read failure 90% 7432 92290592
# 4 Short offline Completed: read failure 90% 7431 92290596
# 5 Extended offline Completed: read failure 90% 7431 92290592
¿Entonces este disco está fallando?
Respuesta1
Su unidad estará encantada de realizar una autoprueba; Según el resumen, ha realizado más de cinco de ellos en la última hora. Y todos ellos fallaron, al principio de la prueba, con errores de lectura.
Sí, este disco duro está fallando. Como decía el famoso informe de Google Labs (aunque no puedo encontrar un enlace en este momento), si smartctl
dice que su disco está fallando, probablemente así sea (parafraseo).
Editar: no intentes guardarlo. Saque todos los datos y reemplácelos.
Respuesta2
Para responder a su pregunta, una prueba SMART fallida es una indicación segura de una falla inminente en la unidad. Debe hacer una copia de seguridad de sus datos y reemplazar la unidad lo antes posible para evitar una posible pérdida de datos.
@sj0h mencionó el recuento de ciclos de carga, que es muy alto, 447 630. (La mayoría de los discos duros modernos están diseñados para soportar 600.000 ciclos de carga/descarga). Esto suele deberse a la función de administración avanzada de energía (APM), que intenta conservar energía estacionando los cabezales (descargándolos de los platos) después de varios segundos de uso. inactivo. Los cabezales se vuelven a cargar en los platos cuando es necesario. En la mayoría de los sistemas, donde los discos duros tienen una actividad de encendido y apagado intermitente, esto puede provocar que se produzcan muchos ciclos de carga/descarga. Para desactivar APM, ejecute el siguiente comando en el indicador raíz:
smartctl -s apm,off /dev/sda
Este comando deberá ejecutarse cada vez que se reinicie el sistema o se ponga en suspensión o se apague la unidad, ya que esta configuración no se conserva cuando se apaga la unidad.
En mi experiencia, hacer esto reducirá drásticamente la cantidad de ciclos de carga/descarga y, en consecuencia, las posibilidades de que vuelva a experimentar este tipo de falla en el futuro. Sin embargo, tenga en cuenta que hacer esto aumenta el consumo de energía y la temperatura de la unidad. Si la unidad funciona constantemente a temperaturas superiores a 50 °C, el riesgo de falla prematura aumenta, por lo que es posible que desee dejar APM encendido (o encenderlo si está apagado) durante los meses más cálidos.
Respuesta3
Aparte de los fallos de lectura, considere también el recuento de ciclos de carga. En casi 500.000 esto puede indicar una razón de falla, o al menos un desgaste por ciclo de carga alta. Hay un ciclo de carga por cada minuto de tiempo de encendido. Después de reemplazar la unidad, asegúrese de que la nueva unidad no esté haciendo lo mismo.
Respuesta4
Yo personalmente reemplazaría la unidad. Si, por alguna razón, no quiere hacer eso todavía, pero permanece con el disco por un tiempo todavía, necesita alguna forma de asegurarse de no utilizar accidentalmente las áreas defectuosas para archivos nuevos.
Tenía una unidad de este tipo en una vieja Mac que simplemente grababa videos y decidí que no quería cambiarla todavía, ya que era bueno tener los videos. Entonces necesitaba aislar los errores. Primero creé una carpeta vacía solo para archivos incorrectos, y luego intenté leer todos los archivos existentes en el disco y cualquiera de los que tenían un error se movieron al directorio de archivos incorrectos (con suerte, solo los que no son importantes).
Luego creé muchos archivos de un megabyte con nombres únicos para llenar el disco duro (de modo que todo el espacio vacío estaba ahora en uno de estos archivos de 1 MB) y luego repetí el procedimiento. Todos los archivos con errores se movieron al directorio de archivos incorrectos, y los que quedaron eran buenos y podían eliminarse para recuperar el espacio incorrecto.
Ahora puede utilizar el disco un poco más, pero no lo utilice para cosas importantes. Élvoluntadfalla más y lo más probable es que sea un inconveniente cuando suceda.