Hintergrund

Question

Schauen Sie sich anSo funktioniert Rsync. Genauer gesagt gibt es einen Generatorprozess und einen Senderprozess, die als Pipeline fungieren. Der Sender liest die Datei, die an die Gegenstelle gesendet werden soll. Der Generator ist für die Generierung der Liste der zu sendenden Dateien verantwortlich. Außerdem werden „Blockprüfsummen für die Basisdatei erstellt und unmittelbar nach der Indexnummer der Datei an den Sender gesendet.“

Das klingt definitiv so, als ob es das Potenzial hat, ein Dateisystem-Thrashing zu verursachen, wenn Sie --inplacemehrere große Dateien sendenund nicht genügend RAM für den Kernel zur Verfügung steht, um zwei aufeinanderfolgende Dateien im Cache zu halten.

Sie können zum Test einzelne Dateien mit übertragen rsync --inpaceund prüfen, ob die Leistung deutlich besser ist. (So etwas wie for i in *.vmdk; do rsync [...]; done.) So sollten Sie feststellen können, ob Ihr Leistungsproblem tatsächlich durch zwei separate Lesegeräte verursacht wird.

Wenn mehrere LeserIstDas Leistungsproblem verursacht wird, dann wäre eine Möglichkeit, die Fähigkeit des Kernels zum Zwischenspeichern der Lesevorgänge zu verbessern, entweder indem dem Host-Kernel mehr RAM zur Verfügung gestellt wird oder indem Sie Ihre einzelnen VMDK-Dateien verkleinern.

Leider sehe ich keine offensichtliche Möglichkeit, das Verhalten der Generator-/Sender-Pipeline in rsync zu ändern, außer ein eigenes Skript zu schreiben, das rsync einmal für jede Datei aufruft. Sie können hierzu auf derrsync-Mailingliste.

Answer 1

Schauen Sie sich anSo funktioniert Rsync. Genauer gesagt gibt es einen Generatorprozess und einen Senderprozess, die als Pipeline fungieren. Der Sender liest die Datei, die an die Gegenstelle gesendet werden soll. Der Generator ist für die Generierung der Liste der zu sendenden Dateien verantwortlich. Außerdem werden „Blockprüfsummen für die Basisdatei erstellt und unmittelbar nach der Indexnummer der Datei an den Sender gesendet.“

Das klingt definitiv so, als ob es das Potenzial hat, ein Dateisystem-Thrashing zu verursachen, wenn Sie --inplacemehrere große Dateien sendenund nicht genügend RAM für den Kernel zur Verfügung steht, um zwei aufeinanderfolgende Dateien im Cache zu halten.

Sie können zum Test einzelne Dateien mit übertragen rsync --inpaceund prüfen, ob die Leistung deutlich besser ist. (So etwas wie for i in *.vmdk; do rsync [...]; done.) So sollten Sie feststellen können, ob Ihr Leistungsproblem tatsächlich durch zwei separate Lesegeräte verursacht wird.

Wenn mehrere LeserIstDas Leistungsproblem verursacht wird, dann wäre eine Möglichkeit, die Fähigkeit des Kernels zum Zwischenspeichern der Lesevorgänge zu verbessern, entweder indem dem Host-Kernel mehr RAM zur Verfügung gestellt wird oder indem Sie Ihre einzelnen VMDK-Dateien verkleinern.

Leider sehe ich keine offensichtliche Möglichkeit, das Verhalten der Generator-/Sender-Pipeline in rsync zu ändern, außer ein eigenes Skript zu schreiben, das rsync einmal für jede Datei aufruft. Sie können hierzu auf derrsync-Mailingliste.

Hintergrund

Hintergrund

Problem

Überwachung

Fragen

Antwort1

verwandte Informationen