wget no funciona en modo recursivo

Question 1

Su problema surge porque todos los enlaces aol.com/index.htmlapuntan a diferentes hosts. Para descargar recursivamente desde todos los hosts, puede agregar la opción --span-hosts. Para permitir todos los hosts de Aol, me pareció funcionar agregar la --span-hosts '*.aol.com'opción.

wget --span-hosts '*.aol.com' -r http://www.aol.com

Puede enumerar los enlaces con

grep -Po '(?<=href=")[^"]*' aol.com/index.html

Verás que la mayoría apuntan a www.aol.com, por lo que también puedes llamar

wget -r http://www.aol.com

Answer

Su problema surge porque todos los enlaces aol.com/index.htmlapuntan a diferentes hosts. Para descargar recursivamente desde todos los hosts, puede agregar la opción --span-hosts. Para permitir todos los hosts de Aol, me pareció funcionar agregar la --span-hosts '*.aol.com'opción.

wget --span-hosts '*.aol.com' -r http://www.aol.com

Puede enumerar los enlaces con

grep -Po '(?<=href=")[^"]*' aol.com/index.html

Verás que la mayoría apuntan a www.aol.com, por lo que también puedes llamar

wget -r http://www.aol.com

Question 2

El uso de lo siguiente permitirá wgetdescargar todas las páginas vinculadas a un sitio web de forma recursiva.

wget -r $(curl http://aol.com | grep -Po '(?<=href=")[^"]*')

Reemplace el sitio web de ejemplo por el que desee. Esto se obtendrá comoDeapth for search in a graph

Método de trabajo curltraerá index.html. Se conectará greppara encontrar todos los enlaces haciendo coincidir href. El resultado ingresado se entregará wgetcomo una variable. wgetrecupera los enlaces uno por uno de la variable.

Answer

El uso de lo siguiente permitirá wgetdescargar todas las páginas vinculadas a un sitio web de forma recursiva.

wget -r $(curl http://aol.com | grep -Po '(?<=href=")[^"]*')

Reemplace el sitio web de ejemplo por el que desee. Esto se obtendrá comoDeapth for search in a graph

Método de trabajo curltraerá index.html. Se conectará greppara encontrar todos los enlaces haciendo coincidir href. El resultado ingresado se entregará wgetcomo una variable. wgetrecupera los enlaces uno por uno de la variable.

wget no funciona en modo recursivo

Respuesta1

Respuesta2

información relacionada