Festplatte sehr langsam, versagt mit immer mehr Fehlern

Festplatte sehr langsam, versagt mit immer mehr Fehlern

Seit ein paar Tagen ist meine Seagate Momentus 7200.4 immer häufiger ausgefallen, möglicherweise aufgrund eines Stromausfalls. Nach der „WARNUNG: Ihre Festplatte ist ausgefallen“ (ich verwende Fedora) war das Hauptsymptom die Langsamkeit: ständiges Warten von 100 % CPU über Stunden, fast unmöglich, irgendetwas zu tun. Ich habe ein Backup erstellt, dann neu gestartet und musste ein e2fsck -y ausführen (viele Ausgaben), was ich später wiederholen musste (hat irgendwann nicht einmal gebootet, Kernel-Panic), ich habe einige lange und kurze Smartctl-Tests durchgeführt, ich habe es eine Nacht lang in Ruhe gelassen, um seine Sektorkorrektur durchzuführen oder was auch immer.

Jetzt scheint die Anzahl der sich ansammelnden Fehler geringer zu sein und der Computer ist größtenteils verwendbar, aber was soll ich tun: Gibt es einen fsck-Befehl mit besseren Ergebnissen oder eine andere Möglichkeit, die fehlerhaften Sektoren zu überspringen und weiter zu funktionieren, als die Sektoren einzeln mit hdparm zu reparieren? Oder ist das Laufwerk definitiv zum Schrott bestimmt?

Auszüge aus smartctl -x /dev/sda:

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  1 Raw_Read_Error_Rate     POSR--   085   074   006    -    243348742
  5 Reallocated_Sector_Ct   PO--CK   100   100   036    -    0
  7 Seek_Error_Rate         POSR--   084   060   030    -    238612361
  9 Power_On_Hours          -O--CK   087   087   000    -    11535
198 Offline_Uncorrectable   ----C-   100   100   000    -    8
199 UDMA_CRC_Error_Count    -OSRCK   200   200   000    -    0
240 Head_Flying_Hours       ------   100   253   000    -    132680129719553
241 Total_LBAs_Written      ------   100   253   000    -    2525013242
242 Total_LBAs_Read         ------   100   253   000    -    2162196433

Error 3759 [18] occurred at disk power-on lifetime: 11535 hours (480 days + 15 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER -- ST COUNT  LBA_48  LH LM LL DV DC
  -- -- -- == -- == == == -- -- -- -- --
  40 -- 51 00 00 00 22 7e 00 3d 2a 00 00  Error: UNC at LBA = 0x227e003d2a = 148142832938

  Commands leading to the command that caused the error were:
  CR FEATR COUNT  LBA_48  LH LM LL DV DC  Powered_Up_Time  Command/Feature_Name
  -- == -- == -- == == == -- -- -- -- --  ---------------  --------------------
  60 00 00 00 08 00 22 7e 00 3d 28 40 00     18:38:24.892  READ FPDMA QUEUED
  27 00 00 00 00 00 00 00 00 00 00 e0 00     18:38:24.891  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 00 00 00 00 00 a0 00     18:38:24.889  IDENTIFY DEVICE
  ef 00 03 00 46 00 00 00 00 00 00 a0 00     18:38:24.889  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 00 00 00 00 00 e0 00     18:38:24.889  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]


SMART Extended Self-test Log Version: 1 (1 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%     11528         574443398

Mehr: http://p.defau.lt/?DTSGCmr7mb_anDD3IQ9Bgg http://p.defau.lt/?hNM7_BusGyz4DYLi9XX0Kg http://p.defau.lt/?wQArANAXPLnpyD87xUY6CA http://p.defau.lt/?hXbtLh27yFZhySu0y9axJw

Aktualisieren: wie Sie sagten, soll die Festplatte bereits gelöscht werden, habe ich dmesg | grep -oE "sector.+$" | sort -u ausgeführt und sudo hdparm --write-sector --yes-i-know-what-i-am-doing 'da dozen sectores. Jetzt führe ich einen weiteren Test durch, mal sehen, was dabei herauskommt.

Aktualisierung 2:Ich musste noch einige weitere fehlerhafte Sektoren mit hdparm manuell reparierenaber eine Nacht später scheinen alle Fehler, die ich im Systemprotokoll finde, erfolgreich automatisch korrigiert worden zu sein, wie es normalerweise der Fall sein sollte. In der Zwischenzeit sind mir einige merkwürdige Fehler untergekommen, wie verzerrter Ton à la Technomusik und Grep, das durchdreht, aber ein Yum-Update hätte möglicherweise ausgereicht, um sie zu beheben. Das letzte smartctl -a /dev/sda wurde ohne Fehler abgeschlossen; ich habe jetzt „ATA-Fehleranzahl: 5004“, 2 für 197 Current_Pending_Sector und 198 Offline_Uncorrectable.

Aktualisierung 3: Das System ist größtenteils verwendbar, aber die Probleme bestehen weiterhin: „ATA-Fehleranzahl: 9484“. Manchmal muss ich den hdparm-Trick anwenden, aber ich glaube, er funktioniert nicht richtig, da das Problem später im folgenden Sektor auftritt. Offline_Uncorrectable wächst nicht, daher vermute ich, dass die Festplatte fehlerhafte Sektoren nicht deaktiviert. Ich schätze, ich muss aufgeben und eine neue kaufen …

Antwort1

Hoffentlich sind alle Ihre Daten gesichert?

Wenn nicht, besorgen Sie sich so schnell wie möglich eine neue Festplatte, die mindestens so groß ist wie die alte, und starten Sie eine lokale Sicherung.

Meiner Erfahrung nach ist es viel einfacher, die Festplatte früher als später auszutauschen.

Wenn Sie jedoch das nötige Kleingeld haben, können Sie in eine Kopie vonSpinrite. Bringen Sie das auf der Festplatte zum Laufen – es kann Tage oder in Extremfällen sogar Wochen dauern. Es kann die Festplatte nicht immer wiederherstellen, aber es gelingt überraschend oft. Tatsächlich holt es regelmäßig Festplatten vom Rand des Abgrunds zurück, ich habe damit schon ein paar Laptops wiederbeleben können. In einem Fall hat es die Festplatte so weit wiederhergestellt, dass sie über 12 Monate später noch verwendet werden kann. Im anderen Fall hat es den Großteil der Daten wiederhergestellt, genug, um eine langsamere Wiederherstellung durchführen zu können. Es kostet allerdings etwa 90 USD, ist also nicht billig. Wenn die Fehler durch einen Stromausfall Ihres Computers verursacht wurden, wird Spinrite das Problem wahrscheinlich problemlos beheben. Wenn nicht, zeigt es Ihnen, wie schlimm die Dinge sind, und verschafft Ihnen möglicherweise genug Zeit, um auf eine andere Festplatte zu kopieren.

Übrigens sollten fehlerhafte Sektoren automatisch von der Firmware auf der Festplatte markiert werden, Sie sollten nicht damit herumspielen. Interessanterweise werden bei der Übung, die Spinrite einer Festplatte unterzieht, fehlerhafte Sektoren recht häufig zurückgesetzt, da sie möglicherweise eher aufgrund einer inkonsistenten Kopfbewegung als aufgrund eines Festplattenfehlers markiert wurden.

Übrigens haben mehrere Forscher herausgefunden, dass die SMART-Warnungen ziemlich nutzlos sind, da sie keine guten Vorhersagen für Festplattenfehler liefern. Google hat eine umfassende Studie zu diesem Thema durchgeführt.

verwandte Informationen