
Я хотел бы узнать, есть ли команда CLI для получения временной метки «Создано» из вкладки «Документ» (из свойств файла PDF) в CLI?
Я знаю, что могу использовать его stat
для получения информации о доступе/изменении/изменении из файловой системы, но поскольку метаданные на вкладке «Документ» встроены в сам файл, я не уверен, как извлечь их через CLI.
Причина, по которой мне это нужно, заключается в том, чтобы создать список имен файлов вместе с временными метками "Создано" для примерно 22 000 файлов PDF. Очевидно, что это гораздо лучше подходит для CLI, чем для GUI.
решение1
Если вы устанавливаете poppler-utils
пакет, вы можете сделать это с помощью pdfinfo
команды. Например:
$ pdfinfo OBEX-1.3.pdf
Title: Microsoft Word - OBEX13.doc
Author: Daphne
Creator: PScript5.dll Version 5.2
Producer: Acrobat Distiller 5.0.5 (Windows)
CreationDate: Wed Feb 5 11:12:32 2003
ModDate: Wed Feb 5 11:12:32 2003
Tagged: no
Pages: 95
Encrypted: no
Page size: 612 x 792 pts (letter)
File size: 545666 bytes
Optimized: yes
PDF version: 1.3
Вы сможете извлечь дату создания из этого вывода, используя стандартные инструменты, такие как sed
или awk
.
Если вам нужно что-то более программное, вы можете использовать библиотеку poppler
напрямую. Существуют привязки для многих популярных языков, включая Python (через python-poppler
пакет).
решение2
Я новичок, но похожеExiftoolможно извлечь это. Например:
% exiftool -createdate -ext pdf .
выведет дату создания для всех PDF-файлов в текущем каталоге. Есть несколько вариантовформат выходного сигнала управления, в том числе -csv
и -json
.