Große Rsync-Übertragungen in Blöcke aufteilen?

Question 1

Meine Lösung hierfür war ein anderer Ansatz mit zwei Durchgängen, bei dem ich etwas Speicherplatz einspare. Ich führe rsync --only-write-batch auf dem Server aus und synchronisiere dann die Batchdatei selbst mit dem Ziel. Dabei führe ich eine Schleife aus, bis das rsync erfolgreich ist. Sobald die Batchdatei vollständig abgeschlossen ist, werden mit rsync --read-batch auf dem Ziel alle Änderungen wiederhergestellt.

Dies hat für mich auch einige unbeabsichtigte Vorteile:

weil ich mehr daran interessiert bin, dass das Backup "existiert" als dass es "verwendbar" ist, führe ich den Lese-Batch auf der Empfangsseite nicht jeden Tag aus -- meistens ist der Batch relativ klein
Ich habe mit --checksum-seed=1 experimentiert ... Vielleicht lese ich die Dokumentation falsch, aber ich glaube, dass die Batchdateien dadurch besser synchronisierbar sind (d. h. wenn ich an einem bestimmten Tag --read-batch nicht ausführe, wird der Batch des nächsten Tages schneller synchronisiert, weil der Batch des vorherigen Tages eine gute Grundlage darstellt).
Wenn der Stapel zu groß wird, um ihn „rechtzeitig“ über das Internet zu senden, kann ich ihn per Sneaker-Net auf ein externes Laufwerk übertragen. Mit „rechtzeitig“ meine ich, dass ich den Stapel nicht übertragen und lesen kann, bevor die Sicherung am nächsten Tag beginnt.
obwohl ich das persönlich nicht mache, könnte ich zwei externe Backups an verschiedenen Standorten haben und den Stapel an beide senden.

Answer

Meine Lösung hierfür war ein anderer Ansatz mit zwei Durchgängen, bei dem ich etwas Speicherplatz einspare. Ich führe rsync --only-write-batch auf dem Server aus und synchronisiere dann die Batchdatei selbst mit dem Ziel. Dabei führe ich eine Schleife aus, bis das rsync erfolgreich ist. Sobald die Batchdatei vollständig abgeschlossen ist, werden mit rsync --read-batch auf dem Ziel alle Änderungen wiederhergestellt.

Dies hat für mich auch einige unbeabsichtigte Vorteile:

weil ich mehr daran interessiert bin, dass das Backup "existiert" als dass es "verwendbar" ist, führe ich den Lese-Batch auf der Empfangsseite nicht jeden Tag aus -- meistens ist der Batch relativ klein
Ich habe mit --checksum-seed=1 experimentiert ... Vielleicht lese ich die Dokumentation falsch, aber ich glaube, dass die Batchdateien dadurch besser synchronisierbar sind (d. h. wenn ich an einem bestimmten Tag --read-batch nicht ausführe, wird der Batch des nächsten Tages schneller synchronisiert, weil der Batch des vorherigen Tages eine gute Grundlage darstellt).
Wenn der Stapel zu groß wird, um ihn „rechtzeitig“ über das Internet zu senden, kann ich ihn per Sneaker-Net auf ein externes Laufwerk übertragen. Mit „rechtzeitig“ meine ich, dass ich den Stapel nicht übertragen und lesen kann, bevor die Sicherung am nächsten Tag beginnt.
obwohl ich das persönlich nicht mache, könnte ich zwei externe Backups an verschiedenen Standorten haben und den Stapel an beide senden.

Question 2

Das beantwortet Ihre Frage nicht direkt, aber eine andere Möglichkeit, die ich ziemlich oft verwende, ist ein zweistufiger Ansatz: Zuerst eine Dateiliste erstellen, dann die Liste der zu übertragenden Dateien aufteilen und die Dateiliste in rsync/cpio/cp usw. einspeisen.

rsync --itemize-changes <rest of options>druckt eine Liste der zu übertragenden Dateien mit einer Reihe nützlicher Metadaten aus. Aus dieser Ausgabe können relativ einfach die Dateinamen extrahiert und dann der eigentliche Kopiervorgang mit einem dieser rsync --files-fromTools oder einem anderen durchgeführt werden.

Könnte in Ihrer Situation nützlich sein – die Fortsetzung einer abgebrochenen Übertragung wäre viel schneller.

Answer

Das beantwortet Ihre Frage nicht direkt, aber eine andere Möglichkeit, die ich ziemlich oft verwende, ist ein zweistufiger Ansatz: Zuerst eine Dateiliste erstellen, dann die Liste der zu übertragenden Dateien aufteilen und die Dateiliste in rsync/cpio/cp usw. einspeisen.

rsync --itemize-changes <rest of options>druckt eine Liste der zu übertragenden Dateien mit einer Reihe nützlicher Metadaten aus. Aus dieser Ausgabe können relativ einfach die Dateinamen extrahiert und dann der eigentliche Kopiervorgang mit einem dieser rsync --files-fromTools oder einem anderen durchgeführt werden.

Könnte in Ihrer Situation nützlich sein – die Fortsetzung einer abgebrochenen Übertragung wäre viel schneller.

Question 3

Ich würde Ihnen vorschlagen, das Verbindungsproblem im Auge zu behalten, anstatt zu versuchen, es durch die Schaffung eines anderen „Problems“ zu lösen.

Das ist kein übliches Verhalten. Verwenden Sie rsync über SSH oder rsyncd?

Soweit ich weiß, treten die meisten „geschlossenen“ Verbindungen auf, wenn keine Daten zwischen den Endpunkten übertragen werden.

Answer

Ich würde Ihnen vorschlagen, das Verbindungsproblem im Auge zu behalten, anstatt zu versuchen, es durch die Schaffung eines anderen „Problems“ zu lösen.

Das ist kein übliches Verhalten. Verwenden Sie rsync über SSH oder rsyncd?

Soweit ich weiß, treten die meisten „geschlossenen“ Verbindungen auf, wenn keine Daten zwischen den Endpunkten übertragen werden.

Große Rsync-Übertragungen in Blöcke aufteilen?

Antwort1

Antwort2

Antwort3

verwandte Informationen