Существуют ли инструменты для обрезки полей PDF-файла?

Существуют ли инструменты для обрезки полей PDF-файла?

У меня есть электронная книга, которую я пытаюсь прочитать в формате PDF на Kindle. К сожалению, верхние и нижние колонтитулы страниц содержат некоторое содержимое (номер страницы и информация об авторских правах соответственно), что не позволяет устройству масштабировать фактический текст в соответствии с его полезной областью просмотра, в результате чего фактический контент становится слишком маленьким для чтения.

Существуют различные инструменты, которые обрезают пустое пространство, но Kindle уже делает это; моя цель, напротив, — удалить печатный текст за пределами определенной ограничивающей рамки, и единственный инструмент, который я нашел для этой цели, — это умеренно дорогое коммерческое программное обеспечение.

Я, вероятно, мог бы сгенерировать маску в Inkscape; разбить отдельные страницы с помощью pdftk, применить маску к каждой странице по отдельности (вывод в postscript) и объединить многочисленные файлы postscript в один PDF. Однако эти шаги декодирования/перекодирования были бы довольно неудачными с точки зрения размера документа; что-то, способное работать с немного большей точностью, было бы идеальным.

У меня под рукой есть все основные операционные системы (Windows, несколько современных дистрибутивов Linux, Mac и т. д.), поэтому решения не должны ограничиваться платформой.

Предложения?

(Я сообщил об этой проблеме автору, который упомянул о ней своему редактору, который за месяц ничего не сделал по этому поводу, что делает подход с нулевым объемом работы явно непродуктивным).

решение1

ПытатьсяБРИСС. Бесплатно, с открытым исходным кодом и кроссплатформенно. Есть хорошее обсуждение этого нафорумы MobileRead.

решение2

Как упоминалось в другом ответе, BRISS великолепен. Еще один действительно удобный инструмент — k2pdfopt (http://www.willus.com/k2pdfopt/). Этот инструмент действительно отлично подходит для оптимизации PDF-файлов для Kindle (или любого устройства с меньшим экраном). Он отлично подходит для научных статей в 2 колонки, поскольку он переформатирует текст, сохраняя уравнения и изображения.

решение3

Как уже было отмеченоk2pdfoptотличный инструмент.

Если вы не против взлома вашего Kindle (и возможного аннулирования гарантии), есть также возможность использовать этот инструмент непосредственно на вашем ридере. Это реализовано тремя форками одного и того же программного пакета:

Они работают с несколькими столбцами, позволяют переформатировать текст и изменять размер шрифта. Они даже умудряются не разрушать научные формулы и изображения при переформатировании.

На данный момент есть небольшие проблемы, такие как пропуски пробелов между двумя словами при переходе на следующую строку, но я не считаю их проблемой. Возможно, они будут исправлены в одной из следующих версий.

решение4

У меня тоже была эта проблема с моим 1200-страничным отсканированным (не английским) PDF. Все инструменты, включая Adobe Acrobat (IX to XI), не смогли обрезать окружающее пустое пространство. Поле нечетной страницы отличалось от поля четных страниц. Хуже того, размер поля был непостоянным. Как@frabjousуказал,Брисспомогло. Однако, когда все страницы документа перекрывались, было замечено, что обрезка не может быть применена, поскольку не было никакого общего эффективного свободного пространства (из-за непоследовательных полей)

Единственным решением для меня было разделить PDF-документ на отдельные страницы, пропустить его через Briss, чтобы удалить поля и объединить заново. Вот шаги, которые я выполнил:

  1. Я разделил этот документ на отдельные страницы с помощью Adobe Acrobat IX, щелкнув , Document->Split documentчто открыло следующее диалоговое окно: введите описание изображения здесь Это действие создало 1200 отдельных PDF-файлов.
  2. Затем я создал пакетный файл со следующим содержимым:for %%d in (*.*) do "C:\Program Files (x86)\Java\jre6\bin\java" -jar "C:\Users\VM\Desktop\briss-0.9\briss-0.9\briss-0.9.jar" -s %%d
  3. Разместил этот пакетный файл в том же месте, где размещены 1200 PDF-файлов, и запустил пакетный файл.
  4. Я снова использовал Adobe Acrobat IX, чтобы объединить все файлы PDF в один файл, и вуаля, у меня был PDF-файл со всеми страницами с минимальными белыми полями, который теперь было чертовски легко читать на планшете.

Совет: В указанном выше содержании пакетного файла я по сути запускаю цикл FORи беру каждый PDF-файл и передаю его в Briss для автоматической обрезки PDF. В зависимости от

  1. где установлен Briss (и архитектура компьютера, т. е. x86 или x64).
  2. где установлена ​​среда выполнения Java.
  3. Среду выполнения Java можно бесплатно загрузить с сайтаздесь

Связанный контент