Fondo

Question

Echa un vistazo aCómo funciona Rsync. Específicamente, hay un proceso generador y un proceso remitente que operan como una canalización. El remitente lee el archivo para enviarlo al control remoto. El generador es responsable de generar la lista de archivos para enviar, y también "las sumas de verificación en bloque se crean para el archivo base y se envían al remitente inmediatamente después del número de índice del archivo".

Definitivamente, esto parece que tiene el potencial de causar daños en el sistema de archivos si lo utiliza --inplacepara enviar varios archivos grandes.y no tengo suficiente RAM disponible para que el kernel almacene dos archivos consecutivos en caché.

Como prueba, puedes intentar transferir archivos individuales rsync --inpacey ver si el rendimiento es significativamente mejor. (Algo como for i in *.vmdk; do rsync [...]; done...) Eso debería ayudar a determinar si tener dos lectores separados realmente está causando el problema de rendimiento.

Si varios lectoresescausando el problema de rendimiento, entonces una posible ruta sería mejorar la capacidad del kernel para almacenar en caché las lecturas, ya sea haciendo que haya más RAM disponible para el kernel host o reduciendo el tamaño de los archivos vmdk individuales.

Desafortunadamente, no veo ninguna forma obvia de cambiar el comportamiento de la canalización del generador/remitente en rsync, salvo escribir su propio script para llamar a rsync una vez para cada archivo. Quizás quieras preguntar sobre esto en ellista de correo rsync.

Answer 1

Echa un vistazo aCómo funciona Rsync. Específicamente, hay un proceso generador y un proceso remitente que operan como una canalización. El remitente lee el archivo para enviarlo al control remoto. El generador es responsable de generar la lista de archivos para enviar, y también "las sumas de verificación en bloque se crean para el archivo base y se envían al remitente inmediatamente después del número de índice del archivo".

Definitivamente, esto parece que tiene el potencial de causar daños en el sistema de archivos si lo utiliza --inplacepara enviar varios archivos grandes.y no tengo suficiente RAM disponible para que el kernel almacene dos archivos consecutivos en caché.

Como prueba, puedes intentar transferir archivos individuales rsync --inpacey ver si el rendimiento es significativamente mejor. (Algo como for i in *.vmdk; do rsync [...]; done...) Eso debería ayudar a determinar si tener dos lectores separados realmente está causando el problema de rendimiento.

Si varios lectoresescausando el problema de rendimiento, entonces una posible ruta sería mejorar la capacidad del kernel para almacenar en caché las lecturas, ya sea haciendo que haya más RAM disponible para el kernel host o reduciendo el tamaño de los archivos vmdk individuales.

Desafortunadamente, no veo ninguna forma obvia de cambiar el comportamiento de la canalización del generador/remitente en rsync, salvo escribir su propio script para llamar a rsync una vez para cada archivo. Quizás quieras preguntar sobre esto en ellista de correo rsync.

Fondo

Fondo

Problema

Observación

Preguntas

Respuesta1

información relacionada