Wir müssen ein Dateisystem mit vielen Hardlinks sichern. Da es für jede „echte“ Datei mehrere Hardlinks gibt, möchten wir beim Sichern des Dateisystems alle Hardlinks überspringen, um n exakte Kopien jeder Datei zu vermeiden.
Die Sicherung wird mit Tivoli Storage Manager Backup durchgeführt und wir konnten es nicht dazu bringen, Hardlinks anders zu behandeln als einzelne Dateien, die nebeneinander gesichert werden.
Falls es für mögliche Lösungen relevant ist, möchte ich darauf hinweisen, dass man einen Hardlink anhand des Dateinamens von einer richtigen Datei unterscheiden kann:
foobarbaz-123.ext # file
foobarbaz-123-1.ext # hardlink
foobarbaz-123-2.ext # hardlink
barbazfoo-456.ext # file
barbazfoo-456-1.ext # hardlink
barbazfoo-456-2.ext # hardlink
barbazfoo-456-3.ext # hardlink
Das bedeutet, dass alle Hardlinks zwei Bindestriche im Dateinamen haben, während richtige Dateien nur einen haben.
Auf dem Server läuft Ubuntu Linux und die Dateien befinden sich auf einem GFS-Volume in unserem SAN.
Antwort1
Ein kurzer Blick in einige TSM-Dokumente rät: „Tun Sie das nicht!“
Unter Unix ist eine „Datei“ einfach ein Verzeichniseintrag, der auf einen Inode zeigt. Ein „Hardlink“ liegt vor, wenn Sie mehr als einen Verzeichniseintrag (Zeiger) haben, der auf einen bestimmten Inode zeigt. Im Grunde sind diese beiden „Dateien“ genau 100 % identisch.
Hardlinks sind ein gut etablierter und verstandener Mechanismus in Unix. Es ist normal und üblich, auf sie zu stoßen, und es ist üblich, dass Backup-Software genau versteht, was ein Hardlink ist, und ihn genau so sichert, wie er sollte – als einen weiteren Zeiger auf ein bestimmtes Datenelement, nicht als ein einzigartiges und neuartiges Datenelement, das zufällig genau dasselbe ist wie die anderen Hardlinks.
Eine schnelle Google-Suche nach „tsm“ und „Hardlinks“ zeigt, dass tsm Hardlinks versteht, und in der Dokumentation wird ausdrücklich davor gewarnt:
Es können Probleme auftreten, wenn Sie nur eine Datei eines fest verknüpften Paares [sichern|archivieren]. Beispielsweise enthalten die Dateien texta und textb einen festen Link zueinander. Sie archivieren texta und bearbeiten dann textb und nehmen Änderungen vor. Wenn Sie texta abrufen, gehen die an textb vorgenommenen Änderungen verloren.
Interessanterweise scheint es zwei verschiedene Möglichkeiten zu geben, mit TSM Backups durchzuführen – Backups und Archive – und die beiden Möglichkeiten scheinen unterschiedlich mit Hardlinks umzugehen.
Sichern und Wiederherstellen von Dateien:
Ein Hardlink wird erstellt, wenn zwei Dateien auf dieselbe Datendatei verweisen. Wenn Sie eine Datei sichern, die einen Hardlink zu einer anderen Datei enthält, speichert TSM sowohl die Linkinformationen als auch die Datendatei auf dem Server. Wenn Sie zwei Dateien sichern, die einen Hardlink zueinander enthalten, speichert TSM dieselbe Datendatei zusammen mit den Linkinformationen unter beiden Namen.
Archivieren und Wiederherstellen von Dateien:
Wenn Sie eine Datei archivieren, die einen Hardlink zu einer anderen Datei enthält, speichert TSM sowohl die Linkinformationen als auch die Datendatei auf dem Server.
Daraus lässt sich schließen, dass Ihr Backup-Server explodiert, wenn er Dinge „archiviert“, und dass er das tut, was Sie wollen, wenn Sie „Backups“ durchführen. Überlassen Sie es IBM, die Sache einfach zu machen!
Antwort2
Erstens gibt es keinen Unterschied zwischen einer „richtigen Datei“ und einem „Hardlink“. Der Hardlink ist lediglich ein anderer Name für dasselbe Objekt, während ein Softlink eigentlich eine Datei ist, die einen Zeiger auf die echte Datei enthält. Deshalb kann ein Softlink Dateisystemgrenzen überschreiten, ein Hardlink jedoch nicht.
Zum eigentlichen Problem: Schauen Sie sich die Exclude-Option und die Include-Exclude-List-Option imDokumentation, Sie sollten in der Lage sein, etwas mit ihnen auszuarbeiten. (wie exclude /path/to/your/files/*-*-?.*
oder so).
Antwort3
Ohne Kenntnisse über den Tivoli Storage Manager wäre es nicht möglich, eine Software dazu zu bringen, Hardlinks anders als Dateien zu behandeln, da zwischen dem ursprünglichen Datei-Handle und den anderen Hardlinks kein tatsächlicher Unterschied besteht. (Es ist möglicherweise möglich, dies auf der Grundlage von Dateinamen zu skripten.)
Antwort4
Aktualisieren Sie auf TSM 6.1 und aktivieren Sie die Deduplizierung. (derzeit nur mit dem Gerätetyp FILE verfügbar, aber Geduld ist eine Tugend)