Как удалить определенную строку/ключ метаданных из PDF-файла?

Question

Этот ответ предполагает, что вы хотите использовать exiftool для этого. Вероятно, есть другие инструменты, которые могут лучше справиться с этой задачей в случае PDF-файлов, особенно если вы хотите нацелиться на отдельные элементы, а не удалить их все.

Сначала вам необходимо определить имя тега (см.FAQ по exiftool №2). В выводе, который вы показываете, перечислены описания тегов, а не имена тегов. Выполните эту команду, чтобы вывести список тегов по имени.
exiftool -s File.PDF

После того, как у вас есть имена тегов, которые вы хотите удалить, ваша команда будет выглядеть так:
exiftool -TAG= <FileOrDir>
В этой команде вы можете очистить несколько тегов и перечислить несколько файлов и каталогов.

Если вы получите ошибку в духе Warning: Tag 'xxx' is not defined, то у вас есть пользовательский тег, который exiftool не может удалить индивидуально. Из опубликованного вами вывода, это, вероятно, так. Вы можете использовать exiftool для удаления всех встроенных метаданных с помощью
exiftool -All:All= <FileOrDir>

У вас все еще могут возникнуть проблемы из-за способа, которым exiftool редактирует файлы (см.PDF-страница exiftool). Возможно, вам придется повторно линеаризовать файл, чтобы завершить проект. Это можно сделать с помощьюQPDFс командой
qpdf --linearize in.pdf out.pdf

Answer 1