Wie entfernt man eine bestimmte Zeile/einen bestimmten Schlüssel von Metadaten aus einer PDF-Datei?

Wie entfernt man eine bestimmte Zeile/einen bestimmten Schlüssel von Metadaten aus einer PDF-Datei?

Ich habe in mehreren Foren gelesen, dass der Universal-PDF-Teil der Metadaten von PDF-Büchern fehlerhaft ist und beim Versuch, daraus zu lesen, Fehler verursacht. Wie entfernt man einen bestimmten Schlüssel und Wert aus dem PDF und werden dadurch die Daten beschädigt?

Hier sind die Daten

File Type                       : PDF
File Type Extension             : pdf
MIME Type                       : application/pdf
PDF Version                     : 1.6
Linearized                      : No
Universal                       : PDF
The                             : process
Code Mantra                     : Acrobat
Author                          : ModDate
LLC                             : http://www.codemantra.com
Create Date                     : 2004:08:26 09:42:01+05:30
EBX PUBLISHER                   : University of Toronto Press
Page Layout                     : SinglePage
Page Count                      : 419
Page Mode                       : UseOutlines
Has XFA                         : No
XMP Toolkit                     : 3.1-702
Code Mantra 002 C0020 LLC       : http://www.codemantra.com
Universal 0020 PDF              : The process that creates this PDF constitutes a trade secret of codeMantra, LLC and is protected by the copyright laws of the United States
Modify Date                     : 2012:09:11 15:27:50+05:30
Metadata Date                   : 2012:09:11 15:27:50+05:30
Creator Tool                    : Acrobat 5.0 Paper Capture Plug-in for Windows
Document ID                     : uuid:ccee9833-967a-4d92-b5fa-12faa7d620c4
Instance ID                     : uuid:51e5148e-3afa-45df-82b8-26d43c7e6ffc
Format                          : application/pdf
Title                           : 
Creator                         : .

Jede Hilfe wäre willkommen

Antwort1

Diese Antwort setzt voraus, dass Sie hierfür Exiftool verwenden möchten. Es gibt wahrscheinlich andere Tools, die die Aufgabe bei PDFs besser erledigen könnten, insbesondere wenn Sie einzelne Elemente gezielt ansprechen, aber nicht alle entfernen möchten.

Zunächst müssen Sie den Tag-Namen bestimmen (sieheexiftool FAQ #2). Die angezeigte Ausgabe listet die Tag-Beschreibungen auf, nicht die Tag-Namen. Führen Sie diesen Befehl aus, um die Tags nach Namen aufzulisten.
exiftool -s File.PDF

Sobald Sie die Tag-Namen haben, die Sie entfernen möchten, lautet Ihr Befehl:
exiftool -TAG= <FileOrDir>
Sie können mit diesem Befehl mehrere Tags löschen und mehrere Dateien und Verzeichnisse auflisten.

Wenn Sie einen Fehler wie diesen erhalten Warning: Tag 'xxx' is not defined, haben Sie ein benutzerdefiniertes Tag, das exiftool nicht einzeln entfernen kann. Aus der von Ihnen geposteten Ausgabe geht hervor, dass dies wahrscheinlich der Fall ist. Sie können exiftool verwenden, um alle eingebetteten Metadaten mit zu entfernen
exiftool -All:All= <FileOrDir>

Möglicherweise treten immer noch Probleme auf, da exiftool die Dateien bearbeitet (sieheExiftool PDF-Seite). Möglicherweise müssen Sie die Datei neu linearisieren, um das Projekt abzuschließen. Dies können Sie tun mitQPDFmit dem Befehl
qpdf --linearize in.pdf out.pdf

verwandte Informationen