Abrufen des „Erstellt“-Zeitstempels einer PDF-Datei in der CLI

Abrufen des „Erstellt“-Zeitstempels einer PDF-Datei in der CLI

Ich möchte wissen, ob es einen CLI-Befehl gibt, um den Zeitstempel „Erstellt“ aus der Registerkarte „Dokument“ (aus den Dateieigenschaften einer PDF-Datei) in der CLI abzurufen?

Ich weiß, dass ich damit statZugriffs-/Geändert-/Geändert-Informationen aus dem Dateisystem abrufen kann, aber da die Metadaten auf der Registerkarte „Dokument“ in die Datei selbst eingebettet sind, bin ich mir nicht sicher, wie ich sie über die CLI extrahieren kann.

Der Grund, warum ich das tun muss, ist, dass ich eine Liste mit Dateinamen und „Erstellt“-Zeitstempeln für etwa 22.000 PDF-Dateien erstellen möchte. Offensichtlich ist dies für die CLI weitaus besser geeignet als für die GUI.

Antwort1

Wenn Sie das poppler-utilsPaket installieren, können Sie dies mit dem Befehl tun pdfinfo. Beispiel:

$ pdfinfo OBEX-1.3.pdf 
Title:          Microsoft Word - OBEX13.doc
Author:         Daphne
Creator:        PScript5.dll Version 5.2
Producer:       Acrobat Distiller 5.0.5 (Windows)
CreationDate:   Wed Feb  5 11:12:32 2003
ModDate:        Wed Feb  5 11:12:32 2003
Tagged:         no
Pages:          95
Encrypted:      no
Page size:      612 x 792 pts (letter)
File size:      545666 bytes
Optimized:      yes
PDF version:    1.3

Sie sollten in der Lage sein, das Erstellungsdatum aus dieser Ausgabe mit Standardtools wie sedoder zu extrahieren awk.

Wenn Sie etwas mehr Programmorientiertes möchten, können Sie die popplerBibliothek direkt verwenden. Es gibt Bindungen für viele gängige Sprachen, einschließlich Python (über das python-popplerPaket).

Antwort2

Ich bin neu dabei, aber es sieht aus wieExiftoolkann dies extrahieren. Zum Beispiel:

% exiftool -createdate -ext pdf .

gibt das Erstellungsdatum für alle PDFs im aktuellen Verzeichnis aus. Es gibt einige Optionen, umSteuerausgabeformat, einschließlich -csvund -json.

verwandte Informationen