
CLI의 "문서" 탭(PDF의 파일 속성)에서 "생성됨" 타임스탬프를 가져오는 CLI 명령이 있는지 알고 싶습니다.
파일 시스템에서 액세스/수정/변경 정보를 얻는 데 사용할 수 있다는 것을 알고 있지만 stat
"문서" 탭의 메타데이터가 파일 자체에 포함되어 있으므로 다음을 통해 정보를 추출하는 방법을 잘 모르겠습니다. CLI.
이 작업을 수행해야 하는 이유는 약 22,000개의 PDF 파일에 대해 "생성됨" 타임스탬프와 함께 파일 이름 목록을 만들기 위해서입니다. 분명히 이것은 GUI보다 CLI에 훨씬 더 적합한 것입니다.
답변1
패키지를 설치하는 경우 명령 poppler-utils
을 사용하여 이를 수행할 수 있습니다 pdfinfo
. 예를 들어:
$ pdfinfo OBEX-1.3.pdf
Title: Microsoft Word - OBEX13.doc
Author: Daphne
Creator: PScript5.dll Version 5.2
Producer: Acrobat Distiller 5.0.5 (Windows)
CreationDate: Wed Feb 5 11:12:32 2003
ModDate: Wed Feb 5 11:12:32 2003
Tagged: no
Pages: 95
Encrypted: no
Page size: 612 x 792 pts (letter)
File size: 545666 bytes
Optimized: yes
PDF version: 1.3
sed
또는 같은 표준 도구를 사용하여 이 출력에서 생성 날짜를 추출할 수 있어야 합니다 awk
.
좀 더 프로그래밍적인 것을 원한다면 poppler
라이브러리를 직접 사용할 수 있습니다. Python을 포함한 많은 인기 언어에 대한 바인딩이 있습니다( python-poppler
패키지를 통해).