
Ich möchte wissen, ob es einen CLI-Befehl gibt, um den Zeitstempel „Erstellt“ aus der Registerkarte „Dokument“ (aus den Dateieigenschaften einer PDF-Datei) in der CLI abzurufen?
Ich weiß, dass ich damit stat
Zugriffs-/Geändert-/Geändert-Informationen aus dem Dateisystem abrufen kann, aber da die Metadaten auf der Registerkarte „Dokument“ in die Datei selbst eingebettet sind, bin ich mir nicht sicher, wie ich sie über die CLI extrahieren kann.
Der Grund, warum ich das tun muss, ist, dass ich eine Liste mit Dateinamen und „Erstellt“-Zeitstempeln für etwa 22.000 PDF-Dateien erstellen möchte. Offensichtlich ist dies für die CLI weitaus besser geeignet als für die GUI.
Antwort1
Wenn Sie das poppler-utils
Paket installieren, können Sie dies mit dem Befehl tun pdfinfo
. Beispiel:
$ pdfinfo OBEX-1.3.pdf
Title: Microsoft Word - OBEX13.doc
Author: Daphne
Creator: PScript5.dll Version 5.2
Producer: Acrobat Distiller 5.0.5 (Windows)
CreationDate: Wed Feb 5 11:12:32 2003
ModDate: Wed Feb 5 11:12:32 2003
Tagged: no
Pages: 95
Encrypted: no
Page size: 612 x 792 pts (letter)
File size: 545666 bytes
Optimized: yes
PDF version: 1.3
Sie sollten in der Lage sein, das Erstellungsdatum aus dieser Ausgabe mit Standardtools wie sed
oder zu extrahieren awk
.
Wenn Sie etwas mehr Programmorientiertes möchten, können Sie die poppler
Bibliothek direkt verwenden. Es gibt Bindungen für viele gängige Sprachen, einschließlich Python (über das python-poppler
Paket).
Antwort2
Ich bin neu dabei, aber es sieht aus wieExiftoolkann dies extrahieren. Zum Beispiel:
% exiftool -createdate -ext pdf .
gibt das Erstellungsdatum für alle PDFs im aktuellen Verzeichnis aus. Es gibt einige Optionen, umSteuerausgabeformat, einschließlich -csv
und -json
.