wget não funciona em modo recursivo

Question 1

Seu problema surge porque todos os links aol.com/index.htmlapontam para hosts diferentes. Para fazer download recursivamente de todos os hosts, você pode adicionar a opção --span-hosts. Para permitir todos os hosts aol, pareceu funcionar para mim adicionar a --span-hosts '*.aol.com'opção.

wget --span-hosts '*.aol.com' -r http://www.aol.com

Você pode listar os links com

grep -Po '(?<=href=")[^"]*' aol.com/index.html

Você verá que a maioria deles aponta para www.aol.com, então você também pode ligar

wget -r http://www.aol.com

Answer

Seu problema surge porque todos os links aol.com/index.htmlapontam para hosts diferentes. Para fazer download recursivamente de todos os hosts, você pode adicionar a opção --span-hosts. Para permitir todos os hosts aol, pareceu funcionar para mim adicionar a --span-hosts '*.aol.com'opção.

wget --span-hosts '*.aol.com' -r http://www.aol.com

Você pode listar os links com

grep -Po '(?<=href=")[^"]*' aol.com/index.html

Você verá que a maioria deles aponta para www.aol.com, então você também pode ligar

wget -r http://www.aol.com

Question 2

Usar o seguinte permitirá wgetbaixar todas as páginas vinculadas a um site recursivamente.

wget -r $(curl http://aol.com | grep -Po '(?<=href=")[^"]*')

Substitua o site de exemplo pelo que você deseja. Isso vai buscar comoDeapth for search in a graph

Método de Trabalho curlvai buscar index.html. Ele será direcionado greppara encontrar todos os links correspondendo a href. O resultado da entrada será fornecido wgetcomo uma variável. wgetbusque os links um por um da variável.

Answer

Usar o seguinte permitirá wgetbaixar todas as páginas vinculadas a um site recursivamente.

wget -r $(curl http://aol.com | grep -Po '(?<=href=")[^"]*')

Substitua o site de exemplo pelo que você deseja. Isso vai buscar comoDeapth for search in a graph

Método de Trabalho curlvai buscar index.html. Ele será direcionado greppara encontrar todos os links correspondendo a href. O resultado da entrada será fornecido wgetcomo uma variável. wgetbusque os links um por um da variável.

wget não funciona em modo recursivo

Responder1

Responder2

informação relacionada