
¿Existe una manera sencilla de mantener una carpeta sincronizada con una lista de directorio a través de HTTP?
Editar:
¡Gracias por el consejo con wget! Creé un script de shell y lo agregué como un trabajo cron:
remote_dirs=( "http://example.com/" "…") # Add your remote HTTP directories here
local_dirs=( "~/examplecom" "…")
for (( i = 0 ; i < ${#local_dirs[@]} ; i++ )) do
cd "${local_dirs[$i]}"
wget -r -l1 --no-parent -A "*.pdf" -nd -nc ${remote_dirs[$i]}
done
# Explanation:
# -r to download recursively
# -l1 to include only one directory depth
# --no-parent to exclude parent directories
# -A "*.pdf" to accept only .pdf files
# -nd to prevent wget to create directories for everything
# -N to make wget to download only new files
Edición 2:
Como se menciona a continuación, también se podría usar --mirror
( -m
), que es la abreviatura de -r -N
.
Respuesta1
wget
es una gran herramienta.
Usarwget -m http://somesite.com/directory
-m
--mirror
Turn on options suitable for mirroring. This option turns on
recursion and time-stamping, sets infinite recursion depth and
keeps FTP directory listings. It is currently equivalent to
-r -N -l inf --no-remove-listing.
Respuesta2
Como rsync, pero usasincronizarpara obtener desde un servidor httpd.