Migración de Azure NFS desde NFS local

Question

Lea man rsynccuidadosamente. Pruebe algunas opciones para --dry-run --itemize-changes ver qué se haría exactamente.

No proporcionar ninguna opción de eliminación significa que una eliminación en el origen no se reflejará en el destino. Excelente para casos de uso de archivo, no tan bueno para algo con una retención limitada como archivos de registro con fecha estampada. Además, evite los comodines * si desea eliminar archivos, por página de manual:

   --delete
          This  tells rsync to delete extraneous files from the receiving side (ones that aren't on the sending
          side), but only for the directories that are being synchronized.  You must have asked rsync  to  send
          the  whole  directory  (e.g.  "dir"  or "dir/") without using a wildcard for the directory's contents
          (e.g. "dir/*") since the wildcard is expanded by the shell and rsync thus gets a request to  transfer
          individual  files,  not  the  files' parent directory.

"El comportamiento predeterminado es crear cada archivo temporal en el mismo directorio que el archivo de destino asociado". Estos archivos temporales permiten cancelar la transferencia, pero requieren un espacio adicional significativo. De manera conservadora, asuma el doble del tamaño de la fuente, en el peor de los casos, en el que sea necesario actualizar todo. De las formas de cambiar este comportamiento, quizás la más agresiva sea --inplacela que sobrescribe los archivos directamente. Peligro: esto dañará los archivos en uso en el destino, no es para casos de uso activo/activo.

En cuanto al rendimiento, encuentre cuáles son los factores limitantes tanto de los sistemas locales como de los remotos. Si invento los números del peor de los casos, un millón de archivos en ejes lentos de 100 IOPS podrían llevar horas simplemente para enumerar y comparar la lista de archivos. Sin embargo, cuando se trata de copiar datos de archivos, los cuellos de botella pueden pasar al ancho de banda de la red y a la CPU para ssh y compresión.

Piense en planes alternativos para una copia inicial que no sean herramientas de sincronización de archivos. Por ejemplo, realice una copia de seguridad local del recurso compartido y restáurela en un host en Azure con ese NFS montado. Es más rápido y sencillo copiar un archivo (.tar o lo que sea) a través de la red y extraerlo todo, en comparación con la sincronización incremental de archivos.

Hablando de eso, rsync podría ser útil como incremental para ponerse al día después de la copia inicial. Todavía llevará algún tiempo comparar, pero mucho más rápido si la tasa de cambio es baja y no hay mucho que copiar.

Answer 1

Lea man rsynccuidadosamente. Pruebe algunas opciones para --dry-run --itemize-changes ver qué se haría exactamente.

No proporcionar ninguna opción de eliminación significa que una eliminación en el origen no se reflejará en el destino. Excelente para casos de uso de archivo, no tan bueno para algo con una retención limitada como archivos de registro con fecha estampada. Además, evite los comodines * si desea eliminar archivos, por página de manual:

   --delete
          This  tells rsync to delete extraneous files from the receiving side (ones that aren't on the sending
          side), but only for the directories that are being synchronized.  You must have asked rsync  to  send
          the  whole  directory  (e.g.  "dir"  or "dir/") without using a wildcard for the directory's contents
          (e.g. "dir/*") since the wildcard is expanded by the shell and rsync thus gets a request to  transfer
          individual  files,  not  the  files' parent directory.

"El comportamiento predeterminado es crear cada archivo temporal en el mismo directorio que el archivo de destino asociado". Estos archivos temporales permiten cancelar la transferencia, pero requieren un espacio adicional significativo. De manera conservadora, asuma el doble del tamaño de la fuente, en el peor de los casos, en el que sea necesario actualizar todo. De las formas de cambiar este comportamiento, quizás la más agresiva sea --inplacela que sobrescribe los archivos directamente. Peligro: esto dañará los archivos en uso en el destino, no es para casos de uso activo/activo.

En cuanto al rendimiento, encuentre cuáles son los factores limitantes tanto de los sistemas locales como de los remotos. Si invento los números del peor de los casos, un millón de archivos en ejes lentos de 100 IOPS podrían llevar horas simplemente para enumerar y comparar la lista de archivos. Sin embargo, cuando se trata de copiar datos de archivos, los cuellos de botella pueden pasar al ancho de banda de la red y a la CPU para ssh y compresión.

Piense en planes alternativos para una copia inicial que no sean herramientas de sincronización de archivos. Por ejemplo, realice una copia de seguridad local del recurso compartido y restáurela en un host en Azure con ese NFS montado. Es más rápido y sencillo copiar un archivo (.tar o lo que sea) a través de la red y extraerlo todo, en comparación con la sincronización incremental de archivos.

Hablando de eso, rsync podría ser útil como incremental para ponerse al día después de la copia inicial. Todavía llevará algún tiempo comparar, pero mucho más rápido si la tasa de cambio es baja y no hay mucho que copiar.

Migración de Azure NFS desde NFS local

Respuesta1

información relacionada