
Preciso pegar uma página da web (página única, não todos os sites) com todos os seus ativos (imagens/css) na linha de comando.
Eu realmente gosto de como o Google Chrome faz isso - se eu salvar uma página da Web, recebo um único arquivo HTML e um único diretório com todos os ativos. Além disso, todos os caminhos para imagens são alterados para locais e todos os links são absolutos (se fosse "/pricing", torna-se "http://example.com/pricing").
Eu sei que posso fazer isso wget
, mas não gosto do resultado - muitos diretórios (se houver imagens de domínios diferentes) e o arquivo html está em algum lugar do diretório (com nome de domínio).
Gostei muito do resultado depois de salvar a página com o google chrome e preciso saber se você conhece alguns rastreadores de linha de comando que produzem resultados semelhantes.
Ou você sabe como configurar wget
para fazer como eu preciso?
Responder1
Obrigado a todos por suas sugestões!
O que eu precisava era de --no-directories
um parâmetro para wget
. Então recebo um diretório com todos os arquivos necessários (arquivo html, imagens, arquivos css).
Desculpe, a pergunta não foi bem formulada.