더 많은 정보를 얻기 위해 PDF 파일에 더 많은 메타데이터를 추가하는 방법

더 많은 정보를 얻기 위해 PDF 파일에 더 많은 메타데이터를 추가하는 방법

나는 PDF와 관련된 흥미로운 콘텐츠, 토론 등을 접할 경우 작성자가 나에게 콘텐츠/PDF를 메일로 보내거나 IM 등으로 동일한 내용을 보내는 경우가 많다는 맥락에서 축복을 받았습니다. . 시간이 지나면서 내용이나 나에게 콘텐츠를 보낸 사람이 누구인지 잊어버립니다. 제한 사항은 모르지만 적어도 몇 개의 필드를 추가할 수 있다고 확신합니다. 예를 들어 여기에 현재 보고 있는 PDF 파일의 메타데이터가 있습니다.

File Size                       : 3.6 MB
File Modification Date/Time     : 2019:11:24 01:11:52+05:30
File Access Date/Time           : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time     : 2019:11:24 01:11:54+05:30
File Permissions                : rw-r--r--
File Type                       : PDF
File Type Extension             : pdf
MIME Type                       : application/pdf
PDF Version                     : 1.4
Linearized                      : No
Page Count                      : 54
Producer                        : Mac OS X 10.11.6 Quartz PDFContext
Creator                         : LaTeX with hyperref package
Create Date                     : 2018:05:01 19:56:31Z
Modify Date                     : 2018:05:01 19:56:31Z

이제 하이퍼링크와 같은 필드를 추가하여(특정 파일을 다운로드한 위치를 기억할 수 있도록) 나중에 콘텐츠/PDF 파일을 공유한 사람이 누구인지 항상 알 수/참조하거나 알아낼 수 있는 방법을 묻습니다. 나랑. 나는 데비안에 있는 pdftk 또는 오히려 pdftk-java에 대한 맨페이지를 보았습니다. 라는 것이 있지만 공유된 예제를 통해 이를 어떻게 사용해야 하는지 이해하기가 쉽지 않습니다. 누군가 도와줄 수 있나요?from : [email protected]update_info

답변1

먼저 문제의 파일의 메타데이터를 내보내야 합니다. 명령

pdftk file.pdf dump_data output metadata

metadata의 모든 메타데이터가 포함된 파일을 생성합니다 file.pdf. 이 파일 안에는 다음 형식의 구조가 있습니다.

...
InfoBegin
InfoKey: Creator
InfoValue: pdftk 3.0.2 - www.pdftk.com
...

다음 줄을 추가하여 자신만의 메타데이터 키를 만들 수 있습니다.

InfoBegin
InfoKey: Hyperlink
InfoValue: [email protected]

파일에. 마지막으로 file.pdf다음 의 메타데이터를 업데이트해야 합니다.

pdftk file.pdf update_info metadata output file2.pdf

후자는 새 파일을 생성합니다 file2.pdf. 이제 file1.pdf추가된 메타데이터가 없는 파일과 file2.pdf사용자 정의 메타데이터 키가 있는 두 개의 파일이 있습니다 . exiftool반환되는 명령 으로 모든 것이 잘 진행되었는지 확인할 수 있습니다.

...
Hyperlink                       : [email protected]
Modify Date                     : 2019:10:08 18:42:36+02:00
Creator                         : pdftk 3.0.2 - www.pdftk.com
Create Date                     : 2019:10:08 18:42:36+02:00
...

답변2

pdftk를 사용하면 다음과 같이 해당 페이지를 새 PDF로 복사하여 문서에서 모든 정보 및 XMP 메타데이터를 제거할 수 있습니다.

pdftk A=mydoc.pdf cat A 출력 mydoc.no_metadata.pdf

관련 정보