ZFS-Backup mit rotierenden Offline-Laufwerken

ZFS-Backup mit rotierenden Offline-Laufwerken

Ich bin gerade dabei, ein ordentliches NAS für zu Hause einzurichten. Das Hauptanliegen ist die Integrität der Daten, und deshalb habe ich mich für ZFS als Dateisystem entschieden. Leider stellt dies einige Anforderungen (oder genauer gesagt Empfehlungen) an die Hardware, die es zu einer ziemlich teuren Lösung machen. Dies verhindert, dass ich ein Offsite-Backup auf einem ähnlichen System durchführen kann, und ich suche daher nach einer alternativen Lösung.

Idealerweise hätte ich drei Wechselfestplatten, von denen eine in der Nähe des Servers steht und etwa wöchentlich angeschlossen wird. Die anderen bleiben außerhalb des Servers und werden ab und zu ausgetauscht. Ich bin mir bewusst, dass dies ein Risiko für neue Daten darstellt, aber ich plane, diese auf eine andere Weise zu sichern.

Die Frage ist, was ich auf die Wechseldatenträger legen soll. Anfangs dachte ich daran, zpoolauf jeden ein zu legen und zpool sendund zu verwenden, zpool recvum sie zu aktualisieren, wieHier. Ich denke jedoch, dass es durchaus möglich ist, dass die Laufwerke „beschädigt“ sind, wenn ich das Backup wiederherstellen muss, und ich möchte, dass ZFS sich darum kümmert. Idealerweise wären alle drei Wechsellaufwerke bis vor zwei Laufwerkswechseln in einer gespiegelten Konfiguration, sodass ZFS sie alle verwenden kann, um Probleme mit den alten Daten beim Wiederherstellen des Backups zu beheben. Die Laufwerke werden jedoch nie gleichzeitig angeschlossen, daher ist dies möglicherweise nicht möglich. Bietet ZFS eine Möglichkeit, das umzusetzen, was ich möchte, oder sollte ich eine andere Methode verwenden?

Antwort1

Leider stellt dies einige Anforderungen (oder genauer gesagt Empfehlungen) an die Hardware, die es zu einer ziemlich teuren Lösung machen. Dies verhindert, dass ich ein Offsite-Backup auf einem ähnlichen System implementieren kann, und ich suche daher nach einer alternativen Lösung.

Ich kenne Ihre genauen Hardware- und Leistungsanforderungen nicht, aber seien Sie sich bewusst, dass anständige Systeme recht günstig sein können, wenn Sie wissen, wonach Sie suchen und einige leichte Nachteile akzeptieren können. Konkret:

  • Die im Internet angegebene Menge an benötigtem RAM ist stark überbewertet, da RAM im Vergleich zu Dutzenden von Festplatten billig ist und RAM für die Leistung entscheidend ist (da es für ARC und Deduplizierung verwendet wird). Wenn Sie nur eine 1-Gbit/s-Ethernet-Verbindung (~110 MB/s) auslasten müssen und hauptsächlich Streaming-Arbeitslast haben (was bedeutet, dass ständig auf die Festplatte statt auf den RAM zugegriffen wird), reichen 4 bis 8 GB Speicher aus (sogar 2 GB könnten noch funktionieren).
  • Enterprise-Festplatten mit 7200 U/min, SAS-Anschlüssen, geringer Fehleranzahl und 200 MB/s Durchsatz sind zwar nett, aber auch nicht wirklich notwendig. Zwei einfache 5200-U/min-Consumer-Festplatten können Ihr Ethernet problemlos überlasten. Zufällige Lesevorgänge sind zwar langsamer, aber Sie haben auch nicht Hunderte von Clients, die jede Sekunde auf verschiedene Dateien zugreifen möchten.
  • Ein HBA von LSI mit 8 SAS-Ports ist eine zuverlässige Wahl, kann aber teuer sein. Die meisten Hardware-SATA-Ports auf Server-Boards stammen von Intel und sind ebenfalls recht zuverlässig. Sie verbrauchen außerdem weniger Strom. Auch hier spielt die Geschwindigkeit keine Rolle, da Sie keine SSDs haben und weder Multipathing noch Extender verwenden.
  • Die CPU-Leistung ist fast bedeutungslos, alle aktuellen Server-CPUs haben mehr als genug Leistung. Einige Dual-Core Celerons im 30€-Bereich unterstützen auch ECC-Speicher, außerdem kann man Low-Power Atom SoCs oder Low-Power Dualcores oder Quadcores von AMD verwenden. Diese Boards haben oft auch schon 6 SATA-Ports und einen PCIe für spätere Erweiterungen, sowie Unterstützung für 16 bis 64 GB Speicher, bei etwa 300€ inklusive CPU, Speicher und Netzteil.
  • Daneben gibt es auch SoHo-Server-Angebote von großen Firmen wie Dell oder HP, bei denen man für 300€ (Skaleneffekte) einen kompletten Server inklusive Gehäuse, Platte und Garantie bekommt. Die Erweiterungsmöglichkeiten sind zwar eingeschränkt, aber 4 bis 6 Platten reichen immer noch.
  • Und schließlich: Wenn Sie in einer Gegend leben, in der Strom billig ist, können Sie sich nach gebrauchter Enterprise-Hardware umsehen. Diese Systeme sind schnell, langlebig und günstig, aber auch laut und stromhungrig. Sie müssen abwägen, ob sich der Kompromiss lohnt.

Ich denke jedoch, dass es durchaus möglich ist, dass die Laufwerke „beschädigt“ sind, wenn ich das Backup wiederherstellen muss, und ich möchte, dass ZFS sich darum kümmert. Idealerweise wären alle drei Wechsellaufwerke bis vor zwei Laufwerkswechseln in einer Spiegelkonfiguration, sodass ZFS sie alle verwenden kann, um Probleme mit den alten Daten beim Wiederherstellen des Backups zu beheben.

Meiner Meinung nach ist es sehr unwahrscheinlich, dass Ihr Live-System mit mindestens einem Zwei-Wege-Spiegel und drei externen Festplatten gleichzeitig ausfällt. Wenn eines der Backups noch verwendbar ist, hätten Sie nur die Daten einer Woche verloren, was viel weniger schwerwiegend ist (und beispielsweise durch ein differenzielles Online-Backup nur neu geänderter Dateien gemildert werden kann).

Aber gehen wir einmal davon aus, dass dies passieren wird, und vergleichen dann alle möglichen Backup-Konfigurationen (jedes Mal unter der Annahme, dass Ihr Live-System über zwei Festplatten als Spiegel verfügt und alle fünf Festplatten gleich groß sind):

3 unabhängige Festplatten, Senden/Empfangen wird verwendet, um Daten mit 3 Pools zu synchronisieren

  • Die Festplatten können Bitfehler nicht korrigieren, aber sie können sie erkennen und Sie können Dateien von den anderen Festplatten wiederherstellen
  • Da sie unabhängig sind, können Sie sie an drei Standorten aufbewahren und über drei verschiedene Backups verfügen (bezüglich Benutzerfehlern, Softwarefehlern).
  • Die Handhabung ist einfach, da jede Festplatte/jeder Pool gleich behandelt wird

3 Festplatten als Spiegel, Sende-/Empfangsfunktion wird zum Synchronisieren von Daten mit einem Pool verwendet

  • Im Wesentlichen ein komplettes Offline-System mit sehr guter Belastbarkeit
  • Auf der anderen Seite haben Sie alle Eier in einem Korb (Diebstahl/Feuer)

3 Festplatten als degradierte Spiegel wie in der verlinkten Frage beschrieben

  • Siehe die verlinkte Antwort für Vor- und Nachteile
  • Sie haben auch nur eine Version

Zusammenfassend lässt sich also sagen: Es hängt davon ab, was für Ihre Anforderungen wichtiger ist – mehrere unabhängige Zeitpunkte oder ein einziger, der widerstandsfähiger gegen Ausfälle ist.

Wenn Sie sich für die zweite Lösung entscheiden, aktivieren Sie unbedingt auch regelmäßige Daten-Snapshots, um sich vor Dingen wie Verschlüsselungs-Malware zu schützen (die durch mehrere Festplatten etwas abgeschwächt werden könnte). Achten Sie außerdem darauf, die drei Festplatten weiterhin zu verteilen und an verschiedenen Orten aufzubewahren, um sie vor Feuer/Diebstahl/Verlust zu schützen.

verwandte Informationen