wkhtmltopdf를 사용하여 웹사이트를 PDF로 변환

wkhtmltopdf를 사용하여 웹사이트를 PDF로 변환

매뉴얼을 변환하려고 합니다.http://101.wacom.com/UserHelp/en/TOC/CTH-490.htmlPDF로.

Arch Linux에서는 다음을 시도했습니다.

wget --recursive --page-requisites --domains wacom.com  http://101.wacom.com/UserHelp/en/TOC/CTH-490.html
wkhtmltopdf 101.wacom.com/UserHelp/en/TOC/CTH-490.html foo.pdf

또한 wkhtmltopdf다음으로 대체됩니다.

htmldoc --webpage -f foo.pdf  101.wacom.com/UserHelp/en/TOC/CTH-490.html                               

첫 번째 페이지만 표시됩니다(거의 비어 있음 htmldoc).

wkhtmltopdf는 커뮤니티 저장소의 버전 0.12.5입니다.
HTMLDOC 버전은 1.9.8입니다.

답변1

이는 동적 페이지, 즉 스크립팅을 통해 내용을 로드하는 HTML로 생성된 빈 셸입니다. HTML 소스를 보고 그것이 어떻게 작동하는지 이해한다면 계획한 대로 정보를 덩어리별로 다운로드할 수 있지만 이를 하나로 모아야 할 것입니다.

동적 사이트를 스크래핑하려고 하는데 이에 대한 좋은 후보 도구는 Python 및 일부 추가 라이브러리입니다.

이것답변도움이 될 수도 있습니다.

관련 정보