
Ich hatte in diesem Zusammenhang das Glück, dass mir der Autor, wenn ich auf interessante Inhalte, Debatten usw. stoße, die PDF-Dateien beinhalten, den Inhalt/das PDF meistens per E-Mail oder per IM oder sonst wie schickt. Mit der Zeit vergesse ich den Kontext oder wer mir den Inhalt geschickt hat. Ich kenne die Grenzen zwar nicht, bin mir aber ziemlich sicher, dass zumindest einige Felder hinzugefügt werden können. Hier sind beispielsweise die Metadaten einer PDF-Datei, die ich gerade ansehe.
File Size : 3.6 MB
File Modification Date/Time : 2019:11:24 01:11:52+05:30
File Access Date/Time : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time : 2019:11:24 01:11:54+05:30
File Permissions : rw-r--r--
File Type : PDF
File Type Extension : pdf
MIME Type : application/pdf
PDF Version : 1.4
Linearized : No
Page Count : 54
Producer : Mac OS X 10.11.6 Quartz PDFContext
Creator : LaTeX with hyperref package
Create Date : 2018:05:01 19:56:31Z
Modify Date : 2018:05:01 19:56:31Z
Jetzt frage ich nach einer Möglichkeit, Felder wie Hyperlinks hinzuzufügen (damit ich mich daran erinnern kann, wo ich die jeweilige Datei heruntergeladen habe) oder damit ich immer weiß/darauf verweisen oder auch später herausfinden kann, wer den Inhalt/die PDF-Datei mit mir geteilt hat. Ich habe die Manpage für pdftk bzw. pdftk-java gesehen, die es in Debian gibt. Dort gibt es etwas namens, aber das Beispiel macht es mir nicht leicht zu verstehen, wie man das verwenden soll. Kann mir jemand helfen?from : [email protected]
update_info
Antwort1
Zunächst müssen die Metadaten der betreffenden Datei exportiert werden. Der Befehl
pdftk file.pdf dump_data output metadata
generiert metadata
eine Datei, die alle Metadaten von enthält file.pdf
. In dieser Datei finden Sie Strukturen der folgenden Form:
...
InfoBegin
InfoKey: Creator
InfoValue: pdftk 3.0.2 - www.pdftk.com
...
Sie können Ihren eigenen Metadatenschlüssel erstellen, indem Sie die Zeilen hinzufügen
InfoBegin
InfoKey: Hyperlink
InfoValue: [email protected]
zur Datei. Schließlich müssen Sie die Metadaten von file.pdf
mit aktualisieren
pdftk file.pdf update_info metadata output file2.pdf
Beachten Sie, dass letzteres eine neue Datei generiert file2.pdf
. Jetzt haben Sie zwei Dateien: file1.pdf
ohne die hinzugefügten Metadaten und file2.pdf
mit Ihrem benutzerdefinierten Metadatenschlüssel. Sie können überprüfen, ob alles gut gegangen ist, mit dem exiftool
Befehl, der zurückgibt
...
Hyperlink : [email protected]
Modify Date : 2019:10:08 18:42:36+02:00
Creator : pdftk 3.0.2 - www.pdftk.com
Create Date : 2019:10:08 18:42:36+02:00
...
Antwort2
Sie können pdftk verwenden, um alle Info- und XMP-Metadaten aus einem Dokument zu entfernen, indem Sie dessen Seiten wie folgt in ein neues PDF kopieren:
pdftk A=mydoc.pdf Katze A Ausgabe mydoc.no_metadata.pdf