Получение временной метки «Создано» для PDF-файла в CLI

Получение временной метки «Создано» для PDF-файла в CLI

Я хотел бы узнать, есть ли команда CLI для получения временной метки «Создано» из вкладки «Документ» (из свойств файла PDF) в CLI?

Я знаю, что могу использовать его statдля получения информации о доступе/изменении/изменении из файловой системы, но поскольку метаданные на вкладке «Документ» встроены в сам файл, я не уверен, как извлечь их через CLI.

Причина, по которой мне это нужно, заключается в том, чтобы создать список имен файлов вместе с временными метками "Создано" для примерно 22 000 файлов PDF. Очевидно, что это гораздо лучше подходит для CLI, чем для GUI.

решение1

Если вы устанавливаете poppler-utilsпакет, вы можете сделать это с помощью pdfinfoкоманды. Например:

$ pdfinfo OBEX-1.3.pdf 
Title:          Microsoft Word - OBEX13.doc
Author:         Daphne
Creator:        PScript5.dll Version 5.2
Producer:       Acrobat Distiller 5.0.5 (Windows)
CreationDate:   Wed Feb  5 11:12:32 2003
ModDate:        Wed Feb  5 11:12:32 2003
Tagged:         no
Pages:          95
Encrypted:      no
Page size:      612 x 792 pts (letter)
File size:      545666 bytes
Optimized:      yes
PDF version:    1.3

Вы сможете извлечь дату создания из этого вывода, используя стандартные инструменты, такие как sedили awk.

Если вам нужно что-то более программное, вы можете использовать библиотеку popplerнапрямую. Существуют привязки для многих популярных языков, включая Python (через python-popplerпакет).

решение2

Я новичок, но похожеExiftoolможно извлечь это. Например:

% exiftool -createdate -ext pdf .

выведет дату создания для всех PDF-файлов в текущем каталоге. Есть несколько вариантовформат выходного сигнала управления, в том числе -csvи -json.

Связанный контент