Sitio web a PDF con wkhtmltopdf

Sitio web a PDF con wkhtmltopdf

Estoy intentando convertir el manual.http://101.wacom.com/UserHelp/en/TOC/CTH-490.htmlen un PDF.

En Arch Linux probé:

wget --recursive --page-requisites --domains wacom.com  http://101.wacom.com/UserHelp/en/TOC/CTH-490.html
wkhtmltopdf 101.wacom.com/UserHelp/en/TOC/CTH-490.html foo.pdf

y también reemplazando wkhtmltopdfcon:

htmldoc --webpage -f foo.pdf  101.wacom.com/UserHelp/en/TOC/CTH-490.html                               

Recibo solo la primera página (casi en blanco con htmldoc).

wkhtmltopdf es la versión 0.12.5 del repositorio de la comunidad.
HTMLDOC es la versión 1.9.8.

Respuesta1

Se trata de una página dinámica, un caparazón vacío creado por HTML que carga su contenido mediante secuencias de comandos. Si observa la fuente HTML y comprende cómo funciona, es posible que pueda descargar la información como lo planeó, por partes, pero tendrá que unirlas.

Está intentando crear un sitio dinámico y una buena herramienta candidata para ello es Python y algunas bibliotecas adicionales.

Esterespuestapodría ayudar.

información relacionada