CLI에서 PDF 파일의 "생성된" 타임스탬프 가져오기

CLI에서 PDF 파일의 "생성된" 타임스탬프 가져오기

CLI의 "문서" 탭(PDF의 파일 속성)에서 "생성됨" 타임스탬프를 가져오는 CLI 명령이 있는지 알고 싶습니다.

파일 시스템에서 액세스/수정/변경 정보를 얻는 데 사용할 수 있다는 것을 알고 있지만 stat"문서" 탭의 메타데이터가 파일 자체에 포함되어 있으므로 다음을 통해 정보를 추출하는 방법을 잘 모르겠습니다. CLI.

이 작업을 수행해야 하는 이유는 약 22,000개의 PDF 파일에 대해 "생성됨" 타임스탬프와 함께 파일 이름 목록을 만들기 위해서입니다. 분명히 이것은 GUI보다 CLI에 훨씬 더 적합한 것입니다.

답변1

패키지를 설치하는 경우 명령 poppler-utils을 사용하여 이를 수행할 수 있습니다 pdfinfo. 예를 들어:

$ pdfinfo OBEX-1.3.pdf 
Title:          Microsoft Word - OBEX13.doc
Author:         Daphne
Creator:        PScript5.dll Version 5.2
Producer:       Acrobat Distiller 5.0.5 (Windows)
CreationDate:   Wed Feb  5 11:12:32 2003
ModDate:        Wed Feb  5 11:12:32 2003
Tagged:         no
Pages:          95
Encrypted:      no
Page size:      612 x 792 pts (letter)
File size:      545666 bytes
Optimized:      yes
PDF version:    1.3

sed또는 같은 표준 도구를 사용하여 이 출력에서 ​​생성 날짜를 추출할 수 있어야 합니다 awk.

좀 더 프로그래밍적인 것을 원한다면 poppler라이브러리를 직접 사용할 수 있습니다. Python을 포함한 많은 인기 언어에 대한 바인딩이 있습니다( python-poppler패키지를 통해).

답변2

나는 그것에 익숙하지 않지만 다음과 같습니다.Exiftool이것을 추출할 수 있습니다. 예를 들어:

% exiftool -createdate -ext pdf .

현재 디렉토리에 있는 모든 PDF의 생성 날짜를 출력합니다. 몇 가지 옵션이 있습니다.제어 출력 형식, 포함 -csv-json.

관련 정보