Was meint 3Wares tw_cli mit einer „DEGRADED“-Festplatte im Vergleich zu „ECC-ERROR“?

Question 1

Ein ECC-Fehler bedeutet, dass sich auf dem Laufwerk mindestens ein nicht lesbarer Sektor befindet. Wenn Sie Glück haben, wird dieser Sektor jedoch möglicherweise nicht vom Dateisystem auf diesem Datenträger verwendet, sodass Sie Ihre Daten in diesem Zustand möglicherweise noch vom Array kopieren können.

Es gibt auch einige Optionen, um ECC-Fehler während des Neuaufbaus zu ignorieren:

/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off

Die Verwendung dieser Optionen bedeutet jedoch, dass der von einem fehlerhaften Sektor betroffene RAID-Streifen beschädigt wird (ich bin nicht sicher, was die Karte in diesem Fall genau tun wird – sie könnte den gesamten Streifen durch Nullen oder sogar durch zufällige Daten ersetzen), sodass das „wiederhergestellte“ Array tatsächlich eine nicht erkennbare Beschädigung aufweisen könnte (wenn sich der betroffene Streifen in der Mitte einer Datendatei befand). Das Kopieren Ihrer Daten vom Array an einen anderen Ort vor dem Wiederherstellungsversuch könnte sicherer sein (zumindest sollten Sie beim Versuch, den fehlerhaften Bereich zu lesen, Fehlermeldungen erhalten).

Sie sollten eine zeitgesteuerte Überprüfung des Arrays einrichten, um nicht lesbare Sektoren früher zu erkennen, sodass Sie ein Laufwerk ersetzen können, das gerade seinen Dienst versagt hat.

Answer

Ein ECC-Fehler bedeutet, dass sich auf dem Laufwerk mindestens ein nicht lesbarer Sektor befindet. Wenn Sie Glück haben, wird dieser Sektor jedoch möglicherweise nicht vom Dateisystem auf diesem Datenträger verwendet, sodass Sie Ihre Daten in diesem Zustand möglicherweise noch vom Array kopieren können.

Es gibt auch einige Optionen, um ECC-Fehler während des Neuaufbaus zu ignorieren:

/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off

Die Verwendung dieser Optionen bedeutet jedoch, dass der von einem fehlerhaften Sektor betroffene RAID-Streifen beschädigt wird (ich bin nicht sicher, was die Karte in diesem Fall genau tun wird – sie könnte den gesamten Streifen durch Nullen oder sogar durch zufällige Daten ersetzen), sodass das „wiederhergestellte“ Array tatsächlich eine nicht erkennbare Beschädigung aufweisen könnte (wenn sich der betroffene Streifen in der Mitte einer Datendatei befand). Das Kopieren Ihrer Daten vom Array an einen anderen Ort vor dem Wiederherstellungsversuch könnte sicherer sein (zumindest sollten Sie beim Versuch, den fehlerhaften Bereich zu lesen, Fehlermeldungen erhalten).

Sie sollten eine zeitgesteuerte Überprüfung des Arrays einrichten, um nicht lesbare Sektoren früher zu erkennen, sodass Sie ein Laufwerk ersetzen können, das gerade seinen Dienst versagt hat.

Question 2

Ich habe noch nie erlebt, dass ein physisches Laufwerk (p0) in den Status DEGRADED wechselte. Sie können jedoch möglicherweise das ECC-ERROR-Laufwerk oder sogar das DEGRADED-Laufwerk wiederherstellen, indem Sie sie über

/c0 p1 remove

und anschließend einen erneuten Scan ausführen

/c0 rescan

stecke sie zurück in die Raid-Einheit über

maint rebuild c0 u0 p1

SATA-Laufwerke, die mit einem ECC-Fehler ausgefallen sind, konnte ich wiederbeleben, wenn auch nur für ein paar Stunden, bevor sie erneut ausfielen.

Answer

Ich habe noch nie erlebt, dass ein physisches Laufwerk (p0) in den Status DEGRADED wechselte. Sie können jedoch möglicherweise das ECC-ERROR-Laufwerk oder sogar das DEGRADED-Laufwerk wiederherstellen, indem Sie sie über

/c0 p1 remove

und anschließend einen erneuten Scan ausführen

/c0 rescan

stecke sie zurück in die Raid-Einheit über

maint rebuild c0 u0 p1

SATA-Laufwerke, die mit einem ECC-Fehler ausgefallen sind, konnte ich wiederbeleben, wenn auch nur für ein paar Stunden, bevor sie erneut ausfielen.

Question 3

Es ist sehr wahrscheinlich, dass Ihre Daten verloren sind. Ein ECC-Fehler bedeutet einen nicht behebbaren Fehler beim Lesen von dieser Festplatte.

Wenn Sie kein Backup haben, können Sie versuchen, den aktuellen Zustand des Arrays zu sichern. Dies ist möglicherweise möglich, weil der Controller nicht weiß, ob Daten verloren gegangen sind oder nur ein leerer Bereich vorhanden ist (ihm fehlt der Einblick in das Dateisystem).

Answer

Es ist sehr wahrscheinlich, dass Ihre Daten verloren sind. Ein ECC-Fehler bedeutet einen nicht behebbaren Fehler beim Lesen von dieser Festplatte.

Wenn Sie kein Backup haben, können Sie versuchen, den aktuellen Zustand des Arrays zu sichern. Dies ist möglicherweise möglich, weil der Controller nicht weiß, ob Daten verloren gegangen sind oder nur ein leerer Bereich vorhanden ist (ihm fehlt der Einblick in das Dateisystem).

Was meint 3Wares tw_cli mit einer „DEGRADED“-Festplatte im Vergleich zu „ECC-ERROR“?

Antwort1

Antwort2

Antwort3

verwandte Informationen