Disco duro muy lento, fallando con cada vez más errores

Disco duro muy lento, fallando con cada vez más errores

Desde hace un par de días, mi Seagate Momentus 7200.4 falla cada vez más, posiblemente debido a un corte de energía. Después del "ADVERTENCIA: Tu disco duro está fallando" (estoy usando Fedora), el síntoma principal fue la lentitud: espera constante de CPU al 100% durante horas, casi imposible hacer algo. Hice una copia de seguridad, luego reinicié y tuve que hacer un e2fsck -y (mucho resultado), que tuve que repetir más tarde (ni siquiera arranqué en algún momento, pánico del kernel), hice algunas pruebas de smartctl largas y En resumen, lo dejé solo por una noche para corregir su sector o lo que sea.

Ahora la cantidad de errores acumulados parece menor y la computadora es en su mayor parte utilizable, pero ¿qué debo hacer? ¿Existe algún comando fsck con mejores efectos o alguna otra forma de hacer que omita los sectores defectuosos y siga funcionando, además de arreglar los sectores? uno por uno con hdparm? ¿O seguramente el disco será destruido?

Extractos de smartctl -x /dev/sda :

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  1 Raw_Read_Error_Rate     POSR--   085   074   006    -    243348742
  5 Reallocated_Sector_Ct   PO--CK   100   100   036    -    0
  7 Seek_Error_Rate         POSR--   084   060   030    -    238612361
  9 Power_On_Hours          -O--CK   087   087   000    -    11535
198 Offline_Uncorrectable   ----C-   100   100   000    -    8
199 UDMA_CRC_Error_Count    -OSRCK   200   200   000    -    0
240 Head_Flying_Hours       ------   100   253   000    -    132680129719553
241 Total_LBAs_Written      ------   100   253   000    -    2525013242
242 Total_LBAs_Read         ------   100   253   000    -    2162196433

Error 3759 [18] occurred at disk power-on lifetime: 11535 hours (480 days + 15 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER -- ST COUNT  LBA_48  LH LM LL DV DC
  -- -- -- == -- == == == -- -- -- -- --
  40 -- 51 00 00 00 22 7e 00 3d 2a 00 00  Error: UNC at LBA = 0x227e003d2a = 148142832938

  Commands leading to the command that caused the error were:
  CR FEATR COUNT  LBA_48  LH LM LL DV DC  Powered_Up_Time  Command/Feature_Name
  -- == -- == -- == == == -- -- -- -- --  ---------------  --------------------
  60 00 00 00 08 00 22 7e 00 3d 28 40 00     18:38:24.892  READ FPDMA QUEUED
  27 00 00 00 00 00 00 00 00 00 00 e0 00     18:38:24.891  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 00 00 00 00 00 a0 00     18:38:24.889  IDENTIFY DEVICE
  ef 00 03 00 46 00 00 00 00 00 00 a0 00     18:38:24.889  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 00 00 00 00 00 e0 00     18:38:24.889  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]


SMART Extended Self-test Log Version: 1 (1 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%     11528         574443398

Más: http://p.defau.lt/?DTSGCmr7mb_anDD3IQ9Bgg http://p.defau.lt/?hNM7_BusGyz4DYLi9XX0Kg http://p.defau.lt/?wQArANAXPLnpyD87xUY6CA http://p.defau.lt/?hXbtLh27yFZhySu0y9axJw

Actualizar: como dijiste, el disco ya se va a desechar, hice dmesg | grep -oE "sector.+$" | sort -u y sudo hdparm --write-sector --yes-i-know-what-i-am-doing 'da una docena de sectores. Ahora realizando otra prueba, veamos qué sale.

Actualización 2:Tuve que arreglar algunos sectores defectuosos más con hdparm manualmentepero, una noche después, todos los errores que encuentro en el registro del sistema parecen haberse corregido automáticamente con éxito como deberían hacerlo normalmente. Mientras tanto, encontré algunos errores divertidos, como sonido distorsionado al estilo de la música techno y grep enloqueciendo, pero una actualización de yum puede haber sido suficiente para repararlos. El último smartctl -a /dev/sda se completó sin errores; Ahora tengo "Recuento de errores ATA: 5004", 2 para 197 Current_Pending_Sector y 198 Offline_Uncorrectable.

Actualización 3: el sistema es prácticamente utilizable, pero los problemas persisten: "Recuento de errores ATA: 9484". A veces tengo que usar el truco hdparm, pero creo que no funciona correctamente porque el problema aparece luego en el siguiente sector. Offline_Uncorrectable no crece, por lo que sospecho que el disco no logra desactivar los sectores defectuosos. Supongo que tendré que rendirme y comprar uno nuevo...

Respuesta1

¿Ojalá todos tus datos estén respaldados?

De lo contrario, obtenga un disco nuevo lo antes posible, uno al menos tan grande como el anterior e inicie una copia de seguridad local.

En mi experiencia es mucho más fácil reemplazar el disco más temprano que tarde.

Sin embargo, si tiene dinero en efectivo, es posible que desee invertir en una copia deespinrita. Haga que se ejecute en el disco; puede llevar días o incluso semanas en casos extremos. No siempre puede recuperar el disco, pero lo hace sorprendentemente a menudo. De hecho, regularmente recuperará los discos del borde del abismo; ya he hecho que resuciten un par de computadoras portátiles. En un caso, recuperó el disco hasta el punto de que todavía está en uso más de 12 meses después. En el otro caso, recuperó la mayoría de los datos, suficientes para poder realizar una reconstrucción más pausada. Cuesta alrededor de 90 dólares, aunque no es barato. Si los errores fueron causados ​​por un corte de energía en su máquina, Spinrite probablemente arreglará las cosas bien. De lo contrario, le mostrará lo mal que están las cosas y puede darle tiempo suficiente para copiar a otro disco.

Por cierto, los sectores defectuosos deberían ser marcados automáticamente por el firmware del disco, no deberías jugar con ellos. Curiosamente, el ejercicio al que Spinrite somete un disco a menudo restablecerá los sectores defectuosos, ya que pueden haber sido marcados debido a un movimiento inconsistente de la cabeza en lugar de a una falla del disco.

Por cierto, como han descubierto varios investigadores, las advertencias SMART son bastante inútiles ya que no predicen bien el fallo del disco. Google hizo un gran estudio al respecto.

información relacionada