осмысление вывода wget -r

Question

Вы можете попробовать пропустить файлы с помощью --rejectпараметра (также принимаются подстановочные знаки):

wget --reject index.html

Однако вы не хотите этого делать. При использовании wget с -r, ему каким-то образом нужно получить список файлов внутри каталога. Таким образом, wget запрашивает файл index.html и анализирует его содержимое в надежде получить пути к другим файлам в этом каталоге. Если в папке нет файла index.html, веб-сервер обычно генерирует его для wget - этот файл будет содержать список каталогов. Создание этого файла списка должно быть включено на веб-сервере - в противном случае wget получит ответ HTTP 404 и завершит рекурсивную загрузку с ошибкой.

Это размер файла в байтах.
Это означает, что файл не может быть удален (вероятно, потому что он не был создан изначально). У вас есть разрешение на запись в каталог, в который вы загружаете с помощью wget?

Редактировать:После тестирования загрузок wget с помощью --spiderи --recursive я воспроизвел вашу ошибку отмены ссылки. Похоже, что wget использует тип содержимого ответа, чтобы определить, может ли файл содержать ссылки на другие ресурсы. Если тест типа содержимого не пройден и файл не загружен, wget все равно попытается удалить временный файл, как если бы он был загружен (это становится очевидным при повторном запуске wget с помощью --debug. Он будет четко указывать Removing file due to --spider in recursive_retrieve():). Я полагаю, вы нашли ошибку в wget.

Answer 1

Вы можете попробовать пропустить файлы с помощью --rejectпараметра (также принимаются подстановочные знаки):

wget --reject index.html

Однако вы не хотите этого делать. При использовании wget с -r, ему каким-то образом нужно получить список файлов внутри каталога. Таким образом, wget запрашивает файл index.html и анализирует его содержимое в надежде получить пути к другим файлам в этом каталоге. Если в папке нет файла index.html, веб-сервер обычно генерирует его для wget - этот файл будет содержать список каталогов. Создание этого файла списка должно быть включено на веб-сервере - в противном случае wget получит ответ HTTP 404 и завершит рекурсивную загрузку с ошибкой.

Это размер файла в байтах.
Это означает, что файл не может быть удален (вероятно, потому что он не был создан изначально). У вас есть разрешение на запись в каталог, в который вы загружаете с помощью wget?

Редактировать:После тестирования загрузок wget с помощью --spiderи --recursive я воспроизвел вашу ошибку отмены ссылки. Похоже, что wget использует тип содержимого ответа, чтобы определить, может ли файл содержать ссылки на другие ресурсы. Если тест типа содержимого не пройден и файл не загружен, wget все равно попытается удалить временный файл, как если бы он был загружен (это становится очевидным при повторном запуске wget с помощью --debug. Он будет четко указывать Removing file due to --spider in recursive_retrieve():). Я полагаю, вы нашли ошибку в wget.

осмысление вывода wget -r

решение1

Связанный контент