Obtener la marca de tiempo "Creado" de un archivo PDF en la CLI

Obtener la marca de tiempo "Creado" de un archivo PDF en la CLI

Me gustaría saber si hay un comando CLI para obtener la marca de tiempo "Creado" de la pestaña "Documento" (de las propiedades del archivo de un PDF) en la CLI.

Sé que puedo usarlo statpara obtener información de acceso/modificada/cambiada del sistema de archivos, pero con los metadatos en la pestaña "Documento" incrustados en el archivo mismo, no estoy seguro de cómo extraerlos a través del CLI.

La razón por la que necesito hacer esto es para crear una lista de nombres de archivos junto con marcas de tiempo "Creadas" para aproximadamente 22.000 archivos PDF. Obviamente, esto es algo mucho más adecuado para la CLI que para la GUI.

Respuesta1

Si instala el poppler-utilspaquete, puede hacerlo usando el pdfinfocomando. Por ejemplo:

$ pdfinfo OBEX-1.3.pdf 
Title:          Microsoft Word - OBEX13.doc
Author:         Daphne
Creator:        PScript5.dll Version 5.2
Producer:       Acrobat Distiller 5.0.5 (Windows)
CreationDate:   Wed Feb  5 11:12:32 2003
ModDate:        Wed Feb  5 11:12:32 2003
Tagged:         no
Pages:          95
Encrypted:      no
Page size:      612 x 792 pts (letter)
File size:      545666 bytes
Optimized:      yes
PDF version:    1.3

Debería poder extraer la fecha de creación de este resultado utilizando herramientas estándar como sedo awk.

Si quieres algo un poco más programático, puedes usar la popplerbiblioteca directamente. Hay enlaces para muchos lenguajes populares, incluido Python (a través del python-popplerpaquete).

Respuesta2

Soy nuevo en esto, pero pareceExiftoolpuede extraer esto. Por ejemplo:

% exiftool -createdate -ext pdf .

generará la fecha de creación de todos los archivos PDF en el directorio actual. Hay algunas opciones paracontrolar el formato de salida, incluyendo -csvy -json.

información relacionada