매뉴얼을 변환하려고 합니다.http://101.wacom.com/UserHelp/en/TOC/CTH-490.htmlPDF로.
Arch Linux에서는 다음을 시도했습니다.
wget --recursive --page-requisites --domains wacom.com http://101.wacom.com/UserHelp/en/TOC/CTH-490.html
wkhtmltopdf 101.wacom.com/UserHelp/en/TOC/CTH-490.html foo.pdf
또한 wkhtmltopdf
다음으로 대체됩니다.
htmldoc --webpage -f foo.pdf 101.wacom.com/UserHelp/en/TOC/CTH-490.html
첫 번째 페이지만 표시됩니다(거의 비어 있음 htmldoc
).
wkhtmltopdf는 커뮤니티 저장소의 버전 0.12.5입니다.
HTMLDOC 버전은 1.9.8입니다.
답변1
이는 동적 페이지, 즉 스크립팅을 통해 내용을 로드하는 HTML로 생성된 빈 셸입니다. HTML 소스를 보고 그것이 어떻게 작동하는지 이해한다면 계획한 대로 정보를 덩어리별로 다운로드할 수 있지만 이를 하나로 모아야 할 것입니다.
동적 사이트를 스크래핑하려고 하는데 이에 대한 좋은 후보 도구는 Python 및 일부 추가 라이브러리입니다.
이것답변도움이 될 수도 있습니다.