Я пытаюсь подключиться к сайту Sharepoint и получить книги Excel из определенной папки. Проблемы, с которыми я сталкиваюсь, в основном в том, что wget получает файлы с каждого уровня. Вот код, который я использую:
wget --http-user='someuser' --http-password="somepassword" -r -l 1 --no-remove-listing
"http://somehost.com/lvl1/lvl2/lvl3/lvl4/lvl5/lvl6/" -nd --cut-dirs 5 --random-wait
Где lvl6 — это каталог, в котором находятся мои файлы. Эта команда вытягивает все файлы с lvl1 по lvl6. Я попытался обойти это, добавив
--accept xlsx --reject aspx
в конец команды (так как большинство посторонних файлов — aspx). Но, как ни странно, это просто заставляет wget извлекать только один файл index.html.
До сих пор я пробовал менять количество рекурсивных уровней (от 0 до 20), добавлять --no-parent и некоторые другие опции, которые не сработали. Есть идеи?