
Я понял, что это pdftk
не обновляет PageLabel
метаданные при использовании update_data_utf8
. У меня есть файл pdf (назовем его file.pdf
), который содержит метаданные
PageLabelBegin
PageLabelNewIndex: 1
PageLabelStart: 1
PageLabelNumStyle: LowercaseLetters
PageLabelBegin
PageLabelNewIndex: 3
PageLabelStart: 1
PageLabelNumStyle: LowercaseRomanNumerals
Если я дам команды
pdftk file.pdf dump_data_utf8 > data.txt
pdftk file.pdf cat 1-end output file2.pdf
pdftk file2.pdf update_info_utf8 data.txt output file2_updated.pdf
Я бы ожидал, что file2_updated.pdf
содержит те же метаданные, что и file.pdf
. Однако все PageLabel
метаданные потеряны. Хотя Bookmark
метаданные, а значит и оглавление, сохранены.
Что здесь происходит? Я ошибся или это баг в pdftk
? Для справки, я использую версию 2.02, которая, похоже,самый новый.
решение1
Вы не делаете ничего неправильного, pdftk никогда не поддерживал обновление меток страниц (хотя код предполагает, что это была запланированная функция). Если вы хотите продолжать использовать программное обеспечение на основе pdftk, я предлагаю форкpdftk-java, который реализует эту отсутствующую функцию. Отказ от ответственности: Я поддерживаю pdftk-java.
решение2
Мне нужна была та же функциональность, но pdftk 3.0.9 (версия по умолчанию в Ubuntu 20.04) не работала. Я скачал последнюю версию pdftk с GitHub (3.2.0), и она работает как часы.