
Некоторые сайты предоставляют книги в виде HTML-страниц (например, юридические материалы).
Что можно использовать для создания PDF-книги из этих страниц на основе уже существующей структуры?
В Windows есть Adobe Professional (коммерческое ПО). Я предполагаю, что в Linux есть что-то бесплатное? Решение с использованием скриптов меня устроит.
решение1
Calibre — довольно мощный инструмент для конвертации вещей в электронные книги в различных форматах. Доступен в Software Centre рядом с вами!
Не обманывайтесь его не слишком красивым пользовательским интерфейсом, он может многое.
решение2
Самый простой способ? Файл > Печать из вашего браузера. ВыберитеПечать в файлкак ваш принтер, и он спросит вас, где вы хотите его. Обязательно отметьте PDF. Нажмите «Печать», и он будет фактически сохранен на вашем диске вместо того, чтобы быть напечатанным.
решение3
Htmldoc может быть полезен, см. его здесь;http://www.htmldoc.org/его можно загрузить из центра программного обеспечения. К сожалению, в версии 1.8 есть проблема с файлами в кодировке Unicode, но во многих случаях он все еще может стать спасением. Проблема исправлена в версии 1.9, находящейся в разработке.
Я обычно использую здесь замечательное расширение для скрапбукинга;http://amb.vis.ne.jp/mozilla/scrapbook/чтобы Firefox мог захватить веб-страницы, используйте инструменты редактирования в Scrapbook, чтобы исправить их, если это необходимо, а затем используйте htmldoc, чтобы преобразовать все страницы в PDF.
решение4
Я бы рекомендовал использовать OpenOffice/LibreOffice для создания PDF. В качестве теста я загрузил Wget manul (все на одной странице), а затем открыл HTML-страницу в OponOffice и нажал кнопку «Экспортировать напрямую в PDF». Он создал PDF с индексом из таблицы содержания.
В прошлом я обнаружил, что это самый простой способ конвертировать HTML-страницы в PDF. Он также позволяет вносить изменения без особых усилий.
Скриншоты: