Site para PDF com wkhtmltopdf

Site para PDF com wkhtmltopdf

Estou tentando converter o manualhttp://101.wacom.com/UserHelp/en/TOC/CTH-490.htmlem um PDF.

No Arch Linux eu tentei:

wget --recursive --page-requisites --domains wacom.com  http://101.wacom.com/UserHelp/en/TOC/CTH-490.html
wkhtmltopdf 101.wacom.com/UserHelp/en/TOC/CTH-490.html foo.pdf

e também substituindo wkhtmltopdfpor:

htmldoc --webpage -f foo.pdf  101.wacom.com/UserHelp/en/TOC/CTH-490.html                               

Recebo apenas a primeira página (quase em branco htmldoc).

wkhtmltopdf é a versão 0.12.5 do repositório da comunidade.
HTMLDOC é a versão 1.9.8.

Responder1

Essa é uma página dinâmica, um shell vazio criado por HTML que carrega seu conteúdo via script. Se você olhar o código-fonte HTML e entender como ele funciona, você poderá baixar as informações conforme planejado, em partes, mas terá que juntá-las.

Você está tentando copiar um site dinâmico, e uma boa ferramenta candidata para isso é python e algumas bibliotecas adicionais.

Esseresponderpode ajudar.

informação relacionada