如何向 pdf 文件添加更多元數據,以便我獲得更多信息

如何向 pdf 文件添加更多元數據,以便我獲得更多信息

我很幸運,很多時候,如果我遇到一些有趣的內容、辯論等,其中涉及一些 pdf,我通常會讓作者將內容/pdf 郵寄給我,或透過 IM 或其他方式向我發送相同的內容。一段時間後,我忘記了上下文或是誰將內容發送給我的。雖然我不知道限制,但我很確定至少可以添加幾個字段。例如,這裡是我目前正在查看的 pdf 檔案的元資料。

File Size                       : 3.6 MB
File Modification Date/Time     : 2019:11:24 01:11:52+05:30
File Access Date/Time           : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time     : 2019:11:24 01:11:54+05:30
File Permissions                : rw-r--r--
File Type                       : PDF
File Type Extension             : pdf
MIME Type                       : application/pdf
PDF Version                     : 1.4
Linearized                      : No
Page Count                      : 54
Producer                        : Mac OS X 10.11.6 Quartz PDFContext
Creator                         : LaTeX with hyperref package
Create Date                     : 2018:05:01 19:56:31Z
Modify Date                     : 2018:05:01 19:56:31Z

現在我問一種可以添加超連結等欄位的方法(這樣我就可以記住從哪裡下載特定文件),或者這樣我總是可以知道/參考或找出誰共享了內容/pdf 文件與我一起。我確實看到了 pdftk 的線上說明頁,或者更確切地說是 Debian 中的 pdftk-java 的線上說明頁。有一個叫做但共享的範例並不能讓我輕鬆理解應該如何使用它。有人可以幫忙嗎?from : [email protected]update_info

答案1

首先,您必須匯出相關文件的元資料。命令

pdftk file.pdf dump_data output metadata

將產生metadata一個包含 的所有元資料的檔案file.pdf。在此文件中,您將找到以下形式的結構:

...
InfoBegin
InfoKey: Creator
InfoValue: pdftk 3.0.2 - www.pdftk.com
...

您可以透過新增以下行來建立自己的元資料金鑰

InfoBegin
InfoKey: Hyperlink
InfoValue: [email protected]

到文件。最後,您需要更新file.pdfwith的元數據

pdftk file.pdf update_info metadata output file2.pdf

請注意,後者會產生一個新檔案file2.pdf。現在,您有兩個檔案:file1.pdf沒有新增的元資料和file2.pdf帶有自訂元資料金鑰。您可以使用exiftool返回的命令檢查一切是否順利

...
Hyperlink                       : [email protected]
Modify Date                     : 2019:10:08 18:42:36+02:00
Creator                         : pdftk 3.0.2 - www.pdftk.com
Create Date                     : 2019:10:08 18:42:36+02:00
...

答案2

您可以使用 pdftk 將文件頁面複製到新的 PDF 中,從而從文件中刪除所有 Info 和 XMP 元數據,如下所示:

pdftk A=mydoc.pdf cat A 輸出 mydoc.no_metadata.pdf

相關內容