как добавить больше метаданных в файл PDF, чтобы иметь больше информации

как добавить больше метаданных в файл PDF, чтобы иметь больше информации

Мне повезло в этом контексте, так как много раз, если я натыкался на какой-то интересный контент, дискуссию и т. д., в которой есть какой-то pdf, чаще всего автор отправлял мне контент/pdf по почте или отправлял мне то же самое в IM или как-то еще. Со временем я забываю контекст или кто отправил мне контент. Хотя я не знаю ограничений, но я почти уверен, что можно добавить по крайней мере пару полей. Например, вот метаданные файла pdf, который я сейчас просматриваю.

File Size                       : 3.6 MB
File Modification Date/Time     : 2019:11:24 01:11:52+05:30
File Access Date/Time           : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time     : 2019:11:24 01:11:54+05:30
File Permissions                : rw-r--r--
File Type                       : PDF
File Type Extension             : pdf
MIME Type                       : application/pdf
PDF Version                     : 1.4
Linearized                      : No
Page Count                      : 54
Producer                        : Mac OS X 10.11.6 Quartz PDFContext
Creator                         : LaTeX with hyperref package
Create Date                     : 2018:05:01 19:56:31Z
Modify Date                     : 2018:05:01 19:56:31Z

Теперь я спрашиваю, как я могу добавить поля, такие как гиперссылка (чтобы я мог вспомнить, откуда я скачал конкретный файл) или чтобы я всегда мог знать/сослаться или узнать даже позже, кто поделился со мной содержимым/файлом pdf. Я видел страницу руководства для pdftk или, скорее, pdftk-java, которая есть в Debian. Есть что-то, что называется, но приведенный пример не позволяет мне легко понять, как это использовать. Может ли кто-нибудь помочь?from : [email protected]update_info

решение1

Прежде всего, вам необходимо экспортировать метаданные нужного файла. Команда

pdftk file.pdf dump_data output metadata

сгенерирует metadata, файл, содержащий все метаданные file.pdf. Внутри этого файла вы найдете структуры следующего вида:

...
InfoBegin
InfoKey: Creator
InfoValue: pdftk 3.0.2 - www.pdftk.com
...

Вы можете создать свой собственный ключ метаданных, добавив строки

InfoBegin
InfoKey: Hyperlink
InfoValue: [email protected]

в файл. Наконец, вам нужно обновить метаданные file.pdfс помощью

pdftk file.pdf update_info metadata output file2.pdf

Обратите внимание, что последний генерирует новый файл file2.pdf. Теперь у вас есть два файла: file1.pdfбез добавленных метаданных и file2.pdfс вашим пользовательским ключом метаданных. Вы можете проверить, все ли прошло хорошо, с помощью exiftoolкоманды, которая возвращает

...
Hyperlink                       : [email protected]
Modify Date                     : 2019:10:08 18:42:36+02:00
Creator                         : pdftk 3.0.2 - www.pdftk.com
Create Date                     : 2019:10:08 18:42:36+02:00
...

решение2

Вы можете использовать pdftk для удаления всех метаданных Info и XMP из документа, скопировав его страницы в новый PDF-файл, например так:

pdftk A=mydoc.pdf cat A вывод mydoc.no_metadata.pdf

Связанный контент