Я хотел бы получить список всех ссылок на заданной веб-странице (рекурсивно). Я не могу понять, как это сделать, не используя wget -r . Я не хочу сохранять весь мусор, только ссылки. Есть идеи?
решение1
Я использую эти команды, чтобы получить только видео YouTube (https://www.youtube.com/watch?v=XXXXXXXXX)
wget --spider --force-html -r -l2 "https://www.youtube.com" 2>&1 | grep --color 'watch?v='
Вы можете использовать это и изменить параметры grep следующим образом: В моем примере, если вы хотите пропустить видео YouTube, используйте «grep -v»:
wget --spider --force-html -r -l2 "https://www.youtube.com" 2>&1 | grep -v 'watch?v='