
Me gustaría saber si hay un comando CLI para obtener la marca de tiempo "Creado" de la pestaña "Documento" (de las propiedades del archivo de un PDF) en la CLI.
Sé que puedo usarlo stat
para obtener información de acceso/modificada/cambiada del sistema de archivos, pero con los metadatos en la pestaña "Documento" incrustados en el archivo mismo, no estoy seguro de cómo extraerlos a través del CLI.
La razón por la que necesito hacer esto es para crear una lista de nombres de archivos junto con marcas de tiempo "Creadas" para aproximadamente 22.000 archivos PDF. Obviamente, esto es algo mucho más adecuado para la CLI que para la GUI.
Respuesta1
Si instala el poppler-utils
paquete, puede hacerlo usando el pdfinfo
comando. Por ejemplo:
$ pdfinfo OBEX-1.3.pdf
Title: Microsoft Word - OBEX13.doc
Author: Daphne
Creator: PScript5.dll Version 5.2
Producer: Acrobat Distiller 5.0.5 (Windows)
CreationDate: Wed Feb 5 11:12:32 2003
ModDate: Wed Feb 5 11:12:32 2003
Tagged: no
Pages: 95
Encrypted: no
Page size: 612 x 792 pts (letter)
File size: 545666 bytes
Optimized: yes
PDF version: 1.3
Debería poder extraer la fecha de creación de este resultado utilizando herramientas estándar como sed
o awk
.
Si quieres algo un poco más programático, puedes usar la poppler
biblioteca directamente. Hay enlaces para muchos lenguajes populares, incluido Python (a través del python-poppler
paquete).
Respuesta2
Soy nuevo en esto, pero pareceExiftoolpuede extraer esto. Por ejemplo:
% exiftool -createdate -ext pdf .
generará la fecha de creación de todos los archivos PDF en el directorio actual. Hay algunas opciones paracontrolar el formato de salida, incluyendo -csv
y -json
.