
Мне повезло в этом контексте, так как много раз, если я натыкался на какой-то интересный контент, дискуссию и т. д., в которой есть какой-то pdf, чаще всего автор отправлял мне контент/pdf по почте или отправлял мне то же самое в IM или как-то еще. Со временем я забываю контекст или кто отправил мне контент. Хотя я не знаю ограничений, но я почти уверен, что можно добавить по крайней мере пару полей. Например, вот метаданные файла pdf, который я сейчас просматриваю.
File Size : 3.6 MB
File Modification Date/Time : 2019:11:24 01:11:52+05:30
File Access Date/Time : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time : 2019:11:24 01:11:54+05:30
File Permissions : rw-r--r--
File Type : PDF
File Type Extension : pdf
MIME Type : application/pdf
PDF Version : 1.4
Linearized : No
Page Count : 54
Producer : Mac OS X 10.11.6 Quartz PDFContext
Creator : LaTeX with hyperref package
Create Date : 2018:05:01 19:56:31Z
Modify Date : 2018:05:01 19:56:31Z
Теперь я спрашиваю, как я могу добавить поля, такие как гиперссылка (чтобы я мог вспомнить, откуда я скачал конкретный файл) или чтобы я всегда мог знать/сослаться или узнать даже позже, кто поделился со мной содержимым/файлом pdf. Я видел страницу руководства для pdftk или, скорее, pdftk-java, которая есть в Debian. Есть что-то, что называется, но приведенный пример не позволяет мне легко понять, как это использовать. Может ли кто-нибудь помочь?from : [email protected]
update_info
решение1
Прежде всего, вам необходимо экспортировать метаданные нужного файла. Команда
pdftk file.pdf dump_data output metadata
сгенерирует metadata
, файл, содержащий все метаданные file.pdf
. Внутри этого файла вы найдете структуры следующего вида:
...
InfoBegin
InfoKey: Creator
InfoValue: pdftk 3.0.2 - www.pdftk.com
...
Вы можете создать свой собственный ключ метаданных, добавив строки
InfoBegin
InfoKey: Hyperlink
InfoValue: [email protected]
в файл. Наконец, вам нужно обновить метаданные file.pdf
с помощью
pdftk file.pdf update_info metadata output file2.pdf
Обратите внимание, что последний генерирует новый файл file2.pdf
. Теперь у вас есть два файла: file1.pdf
без добавленных метаданных и file2.pdf
с вашим пользовательским ключом метаданных. Вы можете проверить, все ли прошло хорошо, с помощью exiftool
команды, которая возвращает
...
Hyperlink : [email protected]
Modify Date : 2019:10:08 18:42:36+02:00
Creator : pdftk 3.0.2 - www.pdftk.com
Create Date : 2019:10:08 18:42:36+02:00
...
решение2
Вы можете использовать pdftk для удаления всех метаданных Info и XMP из документа, скопировав его страницы в новый PDF-файл, например так:
pdftk A=mydoc.pdf cat A вывод mydoc.no_metadata.pdf