
Kontext
Ich habe kürzlich bemerkt, dass mein freeNAS mir mitteilte, dass es Probleme mit einem Laufwerk gab. Ich hatte ungefähr 16 fehlerhafte Sektoren, habe die Smart-Tests usw. durchgeführt. Ich habe ein neues Laufwerk mit derselben Kapazität gekauft, wollte es installieren und aus irgendeinem Grund löste sich ein Netzteil für eines der anderen Laufwerke teilweise, sodass ich 4 von 6 Laufwerken im RAID Z2-Array hatte, also praktisch keine Redundanz.
Das Array begann mit der Neuversilberung, wurde aber nie abgeschlossen und meldete mir immer, dass zu viele Fehler (14k+) aufgetreten seien. Ich habe das mit dem Netzteil herausgefunden, da es unwahrscheinlich war, dass tatsächlich zwei Laufwerke ausfallen würden, insbesondere da das zweite direkt nach dem Öffnen des Gehäuses ausfiel. Ich steckte es wieder ein und ZFS konnte nichts damit anfangen.
Ich habe schließlich das alte Laufwerk (dasselbe Laufwerk, aber ZFS konnte es irgendwie nicht erkennen, Abgleich über gpt/smartctl/zpool) durch sich selbst ersetzt, und ZFS ist wieder zum Resilvering zurückgekehrt.
Natürlich treten immer noch dieselben Fehler auf, jetzt wird auch bei einem dritten Laufwerk ohne Grund ein Resilvering durchgeführt, ich habe einige ZFS-Lösch- und -Bereinigungsvorgänge durchgeführt, aber es wird immer noch jeden Tag den ganzen Tag lang ein Resilvering durchgeführt, es schlägt fehl, ich lösche, führe noch ein paar Resilvering-Vorgänge durch, aber es geht nirgendwo hin.
Abgesehen davon, dass ich zutiefst enttäuscht bin über die Unfähigkeit von ZFS, diese Situation mit relativ geringem Risiko wiederherzustellen, in der tatsächlich nur ein Laufwerk ausgefallen ist und umgehend ersetzt wurde, sind das NAS und sein wichtigster und einziger Share noch verwendbar und ich hatte nach dem ersten Festplattenausfall ohnehin ein Backup durchgeführt.
Frage
Gibt es eine Möglichkeit, ZFS klarzumachen, dass dieser Pool in Ordnung ist und dass es einfach die beiden neuen Laufwerke (eines davon ist ein altes, das ich gelöscht habe, damit ZFS weiß, dass es es verwenden kann) neu versilbern soll und aufhören soll, mir diese Fehler zu melden?
Wie ein Resilver – Force – Scrub_Later – alles_ist_offensichtlich_in_Ordnung – oder_ich_konnte_die_Freigabe_unmöglich_verwenden – einfach_alles_online_markieren – lass_uns_jetzt_zur_eigentlichen_Arbeit_zurückkehren?
Wandern
Ich mache mir ein bisschen Sorgen, da es mir gerade vorgibt, 3 von 6 Laufwerken in einem RAID-Pool neu zu versilbern, der eindeutig verwertbare Daten enthält, obwohl ich ernsthaft bezweifle, dass das überhaupt irgendjemand kann.
Ich gehe davon aus, dass dieser Wert bald auf 4 Laufwerke erhöht wird, oder vielleicht auch auf alle 6, warum nicht, und dass alle meine Daten aus der magnetischen Staubansammlung aus der Luft um die Festplatten herum wiederhergestellt werden.
Jeder Vorschlag ist willkommen. Vielen Dank!
Antwort1
Ich habe nie eine Antwort bekommen und die Dinge wurden schlimmer, bevor sie besser wurden. Insgesamt war es nach mindestens einem Dutzend Resilverings, Scrubs, Clears, dem Entfernen fehlerhafter Dateien und Neustarts wieder online.
Alles in allem bedeutet dies meiner Meinung nach vor allem, dass ZFS gerne große Warnungen ausgibt und der ZPool-Status nicht ganz klar ist, da das Resilvering von 3 von 6 Laufwerken in einem RaidZ2 für eins physikalisch nicht möglich war.
Aber im Großen und Ganzen gilt: Solange Ihre Daten noch verfügbar sind und hinsichtlich der Freigabenutzung alles in Ordnung aussieht, wird es wahrscheinlich genauso gut ausgehen wie hier. Führen Sie einfach weiterhin Neustarts, Scrubbing, Leeren und die Bearbeitung von Dateien mit Prüfsummenfehlern durch.