Эта команда сработала, как и ожидалось (см. верхнюю папку на изображении):
wget -P ~/Downloads -r -A pdf http://www.college-de-france.fr/site/antoine-compagnon/
за исключением того, что он начал извлекать другие папки, не указанные в URL (другие папки, такие как ressources-humaines).
Как это предотвратить?
решение1
Вероятно, вы захотите добавить опцию --no-parent
( -np
для краткости). Это гарантирует, что он будет спускаться только в каталоги, а не куда-то еще.