
여러 포럼에서 PDF 책의 메타데이터 중 Universal PDF 부분의 형식이 잘못되어 읽으려고 할 때 오류가 발생한다는 내용을 읽었습니다. PDF에서 특정 키와 값을 어떻게 제거합니까? 이로 인해 데이터가 손상됩니까?
데이터는 다음과 같습니다
File Type : PDF
File Type Extension : pdf
MIME Type : application/pdf
PDF Version : 1.6
Linearized : No
Universal : PDF
The : process
Code Mantra : Acrobat
Author : ModDate
LLC : http://www.codemantra.com
Create Date : 2004:08:26 09:42:01+05:30
EBX PUBLISHER : University of Toronto Press
Page Layout : SinglePage
Page Count : 419
Page Mode : UseOutlines
Has XFA : No
XMP Toolkit : 3.1-702
Code Mantra 002 C0020 LLC : http://www.codemantra.com
Universal 0020 PDF : The process that creates this PDF constitutes a trade secret of codeMantra, LLC and is protected by the copyright laws of the United States
Modify Date : 2012:09:11 15:27:50+05:30
Metadata Date : 2012:09:11 15:27:50+05:30
Creator Tool : Acrobat 5.0 Paper Capture Plug-in for Windows
Document ID : uuid:ccee9833-967a-4d92-b5fa-12faa7d620c4
Instance ID : uuid:51e5148e-3afa-45df-82b8-26d43c7e6ffc
Format : application/pdf
Title :
Creator : .
어떤 도움이라도 주시면 감사하겠습니다.
답변1
이 답변은 이를 위해 EXIFtool을 사용한다고 가정합니다. PDF의 경우, 특히 개별 항목을 대상으로 하지만 모든 항목을 제거하지는 않으려는 경우 작업을 더 잘 수행할 수 있는 다른 도구가 있을 수 있습니다.
먼저 태그 이름을 결정해야 합니다(참조:엑시툴 FAQ #2). 표시되는 출력에는 태그 이름이 아닌 태그 설명이 나열됩니다. 태그를 이름별로 나열하려면 이 명령을 실행하세요.
exiftool -s File.PDF
제거하려는 태그 이름이 있으면 명령은 다음과 같습니다.
exiftool -TAG= <FileOrDir>
해당 명령에서 여러 태그를 지우고 여러 파일과 디렉터리를 나열할 수 있습니다.
줄을 따라 오류가 발생하면 Warning: Tag 'xxx' is not defined
사용자 정의 태그가 있는 것입니다. 이는 EXIFtool이 개별적으로 제거할 수 없습니다. 게시한 결과에 따르면 아마도 그럴 것입니다. EXIFtool을 사용하여 포함된 모든 메타데이터를 제거할 수 있습니다.
exiftool -All:All= <FileOrDir>
Exiftool이 파일을 편집하는 방식으로 인해 여전히 문제가 있을 수 있습니다(자세한 내용은Exiftool PDF 페이지). 프로젝트를 완료하려면 파일을 다시 선형화해야 할 수도 있습니다. 그것은 할 수 있습니다QPDF명령으로
qpdf --linearize in.pdf out.pdf