¿Cómo se elimina una línea/clave específica de metadatos de un pdf?

¿Cómo se elimina una línea/clave específica de metadatos de un pdf?

He leído en varios foros que la parte de PDF universal de los metadatos de los libros en formato PDF está mal formada y causa errores al intentar leerla. ¿Cómo se elimina una clave y un valor específicos del pdf y eso dañará los datos?

aqui estan los datos

File Type                       : PDF
File Type Extension             : pdf
MIME Type                       : application/pdf
PDF Version                     : 1.6
Linearized                      : No
Universal                       : PDF
The                             : process
Code Mantra                     : Acrobat
Author                          : ModDate
LLC                             : http://www.codemantra.com
Create Date                     : 2004:08:26 09:42:01+05:30
EBX PUBLISHER                   : University of Toronto Press
Page Layout                     : SinglePage
Page Count                      : 419
Page Mode                       : UseOutlines
Has XFA                         : No
XMP Toolkit                     : 3.1-702
Code Mantra 002 C0020 LLC       : http://www.codemantra.com
Universal 0020 PDF              : The process that creates this PDF constitutes a trade secret of codeMantra, LLC and is protected by the copyright laws of the United States
Modify Date                     : 2012:09:11 15:27:50+05:30
Metadata Date                   : 2012:09:11 15:27:50+05:30
Creator Tool                    : Acrobat 5.0 Paper Capture Plug-in for Windows
Document ID                     : uuid:ccee9833-967a-4d92-b5fa-12faa7d620c4
Instance ID                     : uuid:51e5148e-3afa-45df-82b8-26d43c7e6ffc
Format                          : application/pdf
Title                           : 
Creator                         : .

Cualquier ayuda sería apreciada

Respuesta1

Esta respuesta supone que desea utilizar exiftool para esto. Probablemente existan otras herramientas que podrían hacer el trabajo mejor en el caso de archivos PDF, especialmente si desea apuntar a elementos individuales, pero no eliminarlos todos.

Primero, debe determinar el nombre de la etiqueta (consultePreguntas frecuentes sobre exiftool n.º 2). El resultado que muestra enumera las descripciones de las etiquetas, no los nombres de las etiquetas. Ejecute este comando para enumerar las etiquetas por nombre.
exiftool -s File.PDF

Una vez que tenga los nombres de las etiquetas que desea eliminar, su comando sería
exiftool -TAG= <FileOrDir>
Puede borrar varias etiquetas y enumerar varios archivos y directorios en ese comando.

Si recibe un error como Warning: Tag 'xxx' is not defined, entonces tiene una etiqueta personalizada, que exiftool no puede eliminar individualmente. Según el resultado que publicó, este es probablemente el caso. Puede utilizar exiftool para eliminar todos los metadatos incrustados con
exiftool -All:All= <FileOrDir>

Es posible que aún tengas problemas debido a la forma en que exiftool edita los archivos (consulte lapágina PDF de exiftool). Es posible que necesite volver a linealizar el archivo para completar el proyecto. Eso se puede hacer conQPDFcon el comando
qpdf --linearize in.pdf out.pdf

información relacionada