Existe uma maneira de recuperar o código-fonte de cada página da web em um site e salvá-los em um único arquivo de texto? Com os caracteres CRFL apropriados, como se as páginas fossem recuperadas individualmente no Internet Explorer? Eu tentei o Wget, mas não consigo encontrar a combinação certa de opções.
Responder1
Se o servidor web estiver configurado corretamente, não, isso não é possível. Isso ocorre porque se você conseguisse baixar o código-fonte dos sites, seria capaz de recuperar dados valiosos, como os detalhes de autenticação do banco de dados do site.
No entanto, você pode baixar oHTML renderizadoda página da web, conforme aparece no seu navegador da Internet, com wget
:
wget -E -H -k -K -p URLHERE
No entanto, alguns servidores web podem ser tratados wget
como um robô (um programa que coleta e salva dados de páginas web), neste caso você pode usar as -e robots=off
opções em seu wget
comando.