Sincronizar con un listado de directorio de servidor web

Sincronizar con un listado de directorio de servidor web

¿Existe una manera sencilla de mantener una carpeta sincronizada con una lista de directorio a través de HTTP?

Editar:

¡Gracias por el consejo con wget! Creé un script de shell y lo agregué como un trabajo cron:

remote_dirs=( "http://example.com/" "…") # Add your remote HTTP directories here
local_dirs=(  "~/examplecom" "…")

for (( i = 0 ; i < ${#local_dirs[@]} ; i++ )) do
cd "${local_dirs[$i]}"
wget -r -l1 --no-parent -A "*.pdf" -nd -nc ${remote_dirs[$i]}
done

# Explanation:
# -r            to download recursively
# -l1           to include only one directory depth
# --no-parent   to exclude parent directories
# -A "*.pdf"    to accept only .pdf files
# -nd           to prevent wget to create directories for everything
# -N            to make wget to download only new files

Edición 2: Como se menciona a continuación, también se podría usar --mirror( -m), que es la abreviatura de -r -N.

Respuesta1

wgetes una gran herramienta.

Usarwget -m http://somesite.com/directory

-m
--mirror
    Turn on options suitable for mirroring.  This option turns on
    recursion and time-stamping, sets infinite recursion depth and
    keeps FTP directory listings.  It is currently equivalent to 
    -r -N -l inf --no-remove-listing.

Respuesta2

Como rsync, pero usasincronizarpara obtener desde un servidor httpd.

información relacionada