Estou tentando converter o manualhttp://101.wacom.com/UserHelp/en/TOC/CTH-490.htmlem um PDF.
No Arch Linux eu tentei:
wget --recursive --page-requisites --domains wacom.com http://101.wacom.com/UserHelp/en/TOC/CTH-490.html
wkhtmltopdf 101.wacom.com/UserHelp/en/TOC/CTH-490.html foo.pdf
e também substituindo wkhtmltopdf
por:
htmldoc --webpage -f foo.pdf 101.wacom.com/UserHelp/en/TOC/CTH-490.html
Recebo apenas a primeira página (quase em branco htmldoc
).
wkhtmltopdf é a versão 0.12.5 do repositório da comunidade.
HTMLDOC é a versão 1.9.8.
Responder1
Essa é uma página dinâmica, um shell vazio criado por HTML que carrega seu conteúdo via script. Se você olhar o código-fonte HTML e entender como ele funciona, você poderá baixar as informações conforme planejado, em partes, mas terá que juntá-las.
Você está tentando copiar um site dinâmico, e uma boa ferramenta candidata para isso é python e algumas bibliotecas adicionais.
Esseresponderpode ajudar.