SATA-Festplattenfehler

Question 1

Meiner Erfahrung nach sind die Fehler, die Sie sehen, tatsächlich Hardwarefehler, die sich in der Software widerspiegeln. Die Meldung „Seitenschreiben aufgrund eines E/A-Fehlers verloren“ ist eine, die ich bei fehlerhaften Festplatten gesehen habe, und sie verhält sich ähnlich wie Sie es beim Versuch, sie zu fsck. Dies ist mit ziemlicher Sicherheit ein echter Hardwarefehler.

Sie sollten die Ausgabe von smartctl überprüfen, um zu sehen, was dort als mögliches Problem angezeigt wird.

smartctl --attributes /dev/sdb

Sie erhalten eine Ausgabe ähnlich dieser:

=== BEGINN DES ABSCHNITTS „SMART DATA LESEN“ ===
Revisionsnummer der SMART-Attribute-Datenstruktur: 16
Anbieterspezifische SMART-Attribute mit Schwellenwerten:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000f 200 200 051 Vor dem Ausfall Immer - 0
  3 Spin_Up_Time 0x0003 212 186 021 Vor dem Ausfall Immer - 4358
  4 Start_Stop_Count 0x0032 100 100 000 Alter Immer - 97
  5 Reallocated_Sector_Ct 0x0033 200 200 140 Vor dem Ausfall Immer - 0
  7 Seek_Error_Rate 0x000f 200 200 051 Vor dem Ausfall Immer - 0
  9 Einschaltstunden 0x0032 066 066 000 Alter Immer - 25420
 10 Spin_Retry_Count 0x0013 100 253 051 Vor dem Ausfall Immer - 0
 11 Calibration_Retry_Count 0x0013 100 253 051 Vor dem Fehlschlag Immer - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Alter Immer - 86
194 Temperatur_Celsius 0x0022 104 001 000 Alter Immer - 46
196 Reallocated_Event_Count 0x0032 200 200 000 Alter Immer - 0
197 Current_Pending_Sector 0x0012 200 200 000 Alter Immer - 0
198 Offline_Nicht korrigierbar 0x0010 200 200 000 Alter Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Alter Immer - 0
200 Multi_Zone_Error_Rate 0x0009 200 200 051 Vor dem Ausfall Offline - 0

Die Ausgabe kann kompliziert sein, aber ich würde besonders auf Reallocated_Sector_Ct achten, da dies angibt, welche bekannten fehlerhaften Sektoren die Festplatte hat. Der Befehl „smartctl -a“ liefert viel mehr Daten. Auf der fehlerhaften Festplatte, die ich vor einiger Zeit hatte, befindet sich am Ende der Ausgabe das „SMART-Fehlerprotokoll“, das einige Einträge enthielt.

Answer

Meiner Erfahrung nach sind die Fehler, die Sie sehen, tatsächlich Hardwarefehler, die sich in der Software widerspiegeln. Die Meldung „Seitenschreiben aufgrund eines E/A-Fehlers verloren“ ist eine, die ich bei fehlerhaften Festplatten gesehen habe, und sie verhält sich ähnlich wie Sie es beim Versuch, sie zu fsck. Dies ist mit ziemlicher Sicherheit ein echter Hardwarefehler.

Sie sollten die Ausgabe von smartctl überprüfen, um zu sehen, was dort als mögliches Problem angezeigt wird.

smartctl --attributes /dev/sdb

Sie erhalten eine Ausgabe ähnlich dieser:

=== BEGINN DES ABSCHNITTS „SMART DATA LESEN“ ===
Revisionsnummer der SMART-Attribute-Datenstruktur: 16
Anbieterspezifische SMART-Attribute mit Schwellenwerten:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000f 200 200 051 Vor dem Ausfall Immer - 0
  3 Spin_Up_Time 0x0003 212 186 021 Vor dem Ausfall Immer - 4358
  4 Start_Stop_Count 0x0032 100 100 000 Alter Immer - 97
  5 Reallocated_Sector_Ct 0x0033 200 200 140 Vor dem Ausfall Immer - 0
  7 Seek_Error_Rate 0x000f 200 200 051 Vor dem Ausfall Immer - 0
  9 Einschaltstunden 0x0032 066 066 000 Alter Immer - 25420
 10 Spin_Retry_Count 0x0013 100 253 051 Vor dem Ausfall Immer - 0
 11 Calibration_Retry_Count 0x0013 100 253 051 Vor dem Fehlschlag Immer - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Alter Immer - 86
194 Temperatur_Celsius 0x0022 104 001 000 Alter Immer - 46
196 Reallocated_Event_Count 0x0032 200 200 000 Alter Immer - 0
197 Current_Pending_Sector 0x0012 200 200 000 Alter Immer - 0
198 Offline_Nicht korrigierbar 0x0010 200 200 000 Alter Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Alter Immer - 0
200 Multi_Zone_Error_Rate 0x0009 200 200 051 Vor dem Ausfall Offline - 0

Die Ausgabe kann kompliziert sein, aber ich würde besonders auf Reallocated_Sector_Ct achten, da dies angibt, welche bekannten fehlerhaften Sektoren die Festplatte hat. Der Befehl „smartctl -a“ liefert viel mehr Daten. Auf der fehlerhaften Festplatte, die ich vor einiger Zeit hatte, befindet sich am Ende der Ausgabe das „SMART-Fehlerprotokoll“, das einige Einträge enthielt.

Question 2

Es ist ein nicht korrigierbarer Lesefehler aufgetreten.

Error: UNC at LBA = 0x03800922 = 58722594

Die Daten, die sich auf diesem Block befanden, sind jetzt verloren.

Du solltest:

überhaupt einen Spiegel verwenden. Enterprise-Festplatten sind eigentlich für die Verwendung hinter einem Spiegel vorgesehen und geben eher einen Lesefehler zurück, als sich wirklich anzustrengen, um an die Daten zu gelangen.
Stellen Sie verlorene Daten aus Backups wieder her

Sie haben KEINE ENTSCHULDIGUNG, RAID nicht zu verwenden (insbesondere, wenn Sie Websites für Kunden hosten!) – das Betriebssystem ist nicht so groß, Sie benötigen dafür keine dedizierte Festplatte auf einem 2-Festplatten-System.

Answer

Es ist ein nicht korrigierbarer Lesefehler aufgetreten.

Error: UNC at LBA = 0x03800922 = 58722594

Die Daten, die sich auf diesem Block befanden, sind jetzt verloren.

Du solltest:

überhaupt einen Spiegel verwenden. Enterprise-Festplatten sind eigentlich für die Verwendung hinter einem Spiegel vorgesehen und geben eher einen Lesefehler zurück, als sich wirklich anzustrengen, um an die Daten zu gelangen.
Stellen Sie verlorene Daten aus Backups wieder her

Sie haben KEINE ENTSCHULDIGUNG, RAID nicht zu verwenden (insbesondere, wenn Sie Websites für Kunden hosten!) – das Betriebssystem ist nicht so groß, Sie benötigen dafür keine dedizierte Festplatte auf einem 2-Festplatten-System.

Question 3

Verwenden Sie einen RAID-Controller? Welche Art von Controller verwenden Sie?

Eines der Dinge (das sowohl frustrierend als auch aufschlussreich ist) ist die zunehmende Segmentierung, die Festplattenhersteller in den SATA-Markt einführen. Es gibt jetzt Laufwerke für „kleine Unternehmen/RAID-Nutzung“ und „Einzel-/Desktop-Nutzung“. SAS scheint für den „High-End-Unternehmensmarkt“ forciert zu werden.

Ihre Modellnummer ist die Laufwerksserie RE3 von WD, die für RAID-Setups entwickelt wurde. Mir wurde gesagt, dass dies unter anderem bedeutet, dass das Laufwerk beim Versuch, Fehler zu reparieren, früher „aufgibt“ (d. h. innerhalb von 3–4 Sekunden), anstatt es über einen längeren Zeitraum immer wieder zu versuchen. Durch das frühere Aufgeben wird der Fehler dem RAID-Controller gemeldet, sodass dieser ein anderes Laufwerk zur Wiederherstellung verwenden kann. Wenn das Laufwerk stattdessen länger wartet, würde der RAID-Controller das Laufwerk aus dem Array werfen, weil es nicht reagiert.

Fehler solltenTrotzdemselten sein und nicht einmal im Jahr. Vielleicht liegt es an einem anderen Aspekt Ihres Setups? (Ich hatte einmal einen frustrierenden Kampf mit einem SATA-Kabel. Es ist jetzt als Warnung für andere Kabel über meiner Tür angebracht ...)

Answer

Verwenden Sie einen RAID-Controller? Welche Art von Controller verwenden Sie?

Eines der Dinge (das sowohl frustrierend als auch aufschlussreich ist) ist die zunehmende Segmentierung, die Festplattenhersteller in den SATA-Markt einführen. Es gibt jetzt Laufwerke für „kleine Unternehmen/RAID-Nutzung“ und „Einzel-/Desktop-Nutzung“. SAS scheint für den „High-End-Unternehmensmarkt“ forciert zu werden.

Ihre Modellnummer ist die Laufwerksserie RE3 von WD, die für RAID-Setups entwickelt wurde. Mir wurde gesagt, dass dies unter anderem bedeutet, dass das Laufwerk beim Versuch, Fehler zu reparieren, früher „aufgibt“ (d. h. innerhalb von 3–4 Sekunden), anstatt es über einen längeren Zeitraum immer wieder zu versuchen. Durch das frühere Aufgeben wird der Fehler dem RAID-Controller gemeldet, sodass dieser ein anderes Laufwerk zur Wiederherstellung verwenden kann. Wenn das Laufwerk stattdessen länger wartet, würde der RAID-Controller das Laufwerk aus dem Array werfen, weil es nicht reagiert.

Fehler solltenTrotzdemselten sein und nicht einmal im Jahr. Vielleicht liegt es an einem anderen Aspekt Ihres Setups? (Ich hatte einmal einen frustrierenden Kampf mit einem SATA-Kabel. Es ist jetzt als Warnung für andere Kabel über meiner Tür angebracht ...)

Question 4

Ich habe mit Laufwerken von Western Digital sehr schlechte Erfahrungen gemacht. Mehr als die Hälfte meiner Laufwerke musste im Rahmen der Garantie aufgrund von Totalausfällen oder fehlerhaften Sektoren ausgetauscht werden.

Nachdem ich etwa 8 Jahre lang nur WD-Laufwerke gekauft habe, möchte ich kein Geld mehr für sie ausgeben. Ich habe keine Ahnung, welchem WD-Laufwerk ich vertrauen kann; meine bisherigen Erfahrungen sagen: „Keinem von ihnen“.

Sie haben das Originallaufwerk viermal ausgetauscht. Haben Sie alle fünf Laufwerke gleichzeitig gekauft? Haben Sie jedes Laufwerk neu gekauft, wenn es kaputt ging? Haben Sie das Laufwerk im Rahmen der Garantie gegen Ersatz eingesendet? Wie und wann haben Sie die fünf Laufwerke erworben und welche Modelle waren das? Meiner Erfahrung nach sind mehrere Chargen von WD-Laufwerken oft defekt und fallen gleichzeitig aus.

Answer

Ich habe mit Laufwerken von Western Digital sehr schlechte Erfahrungen gemacht. Mehr als die Hälfte meiner Laufwerke musste im Rahmen der Garantie aufgrund von Totalausfällen oder fehlerhaften Sektoren ausgetauscht werden.

Nachdem ich etwa 8 Jahre lang nur WD-Laufwerke gekauft habe, möchte ich kein Geld mehr für sie ausgeben. Ich habe keine Ahnung, welchem WD-Laufwerk ich vertrauen kann; meine bisherigen Erfahrungen sagen: „Keinem von ihnen“.

Sie haben das Originallaufwerk viermal ausgetauscht. Haben Sie alle fünf Laufwerke gleichzeitig gekauft? Haben Sie jedes Laufwerk neu gekauft, wenn es kaputt ging? Haben Sie das Laufwerk im Rahmen der Garantie gegen Ersatz eingesendet? Wie und wann haben Sie die fünf Laufwerke erworben und welche Modelle waren das? Meiner Erfahrung nach sind mehrere Chargen von WD-Laufwerken oft defekt und fallen gleichzeitig aus.

SATA-Festplattenfehler

Antwort1

Antwort2

Antwort3

Antwort4

verwandte Informationen