.png)
Eu preciso de conselhos.
Eu tenho um servidor web vm (LAN, não na internet), ele possui 2 wikis:
Quero wget apenas as páginas wiki do dever de casa, sem entrar no GameWiki?
Meu objetivo é apenas obter os .htmls (ignorar todos os outros arquivos, imagens, etc.), com o wget. (Eu não quero fazer uma exportação mysqldump ou mediawiki, mas sim wget para meu chefe (não-TI) que só quer clicar duas vezes no html).
Como posso executar o wget para rastrear apenas o HomeWorkWiki, e não o GameWiki nesta VM.
Obrigado
Responder1
A solução foi usar o httrack e personalizar o assistente com cuidado, ou este forro brilhante com o wget:
echo "robots = off" > ~/robots.txt ; wget --mirror --convert-links --html-extension --no-parent --wait=0 "http://10.168.0.4/GameWiki"