Este comando funcionó como se esperaba (vea la carpeta superior en la imagen):
wget -P ~/Downloads -r -A pdf http://www.college-de-france.fr/site/antoine-compagnon/
excepto que comenzó a recuperar otras carpetas no especificadas en la URL (las otras carpetas, como recursos-humanos).
¿Cómo prevenir esto?
Respuesta1
Probablemente quieras agregar la opción --no-parent
( -np
para abreviar). Esto garantiza que solo descenderá a directorios y nunca irá a otro lugar.