cómo agregar más metadatos a un archivo pdf para tener más información

cómo agregar más metadatos a un archivo pdf para tener más información

He sido bendecido en el contexto de que muchas veces, si me encuentro con algún contenido interesante, debate, etc. que involucra algún pdf, la mayoría de las veces el autor me envía el contenido/pdf por correo o me envía el mismo por mensajería instantánea o lo que sea. . Con el tiempo, olvido el contexto o quién me envió el contenido. Si bien no conozco los límites, estoy bastante seguro de que se pueden agregar al menos un par de campos. Por ejemplo, aquí hay metadatos de un archivo pdf que estoy viendo actualmente.

File Size                       : 3.6 MB
File Modification Date/Time     : 2019:11:24 01:11:52+05:30
File Access Date/Time           : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time     : 2019:11:24 01:11:54+05:30
File Permissions                : rw-r--r--
File Type                       : PDF
File Type Extension             : pdf
MIME Type                       : application/pdf
PDF Version                     : 1.4
Linearized                      : No
Page Count                      : 54
Producer                        : Mac OS X 10.11.6 Quartz PDFContext
Creator                         : LaTeX with hyperref package
Create Date                     : 2018:05:01 19:56:31Z
Modify Date                     : 2018:05:01 19:56:31Z

Ahora pregunto una forma en la que podría agregar campos como hipervínculo (para poder recordar de dónde descargué el archivo específico) o para poder saber/consultar o descubrir incluso en una fecha posterior quién compartió el contenido/archivo pdf. conmigo. Vi la página de manual de pdftk o más bien pdftk-java que está en Debian. Hay algo que se llama , pero el ejemplo compartido no me facilita entender cómo se supone que se debe usar. ¿Alguien podría ayudar?from : [email protected]update_info

Respuesta1

En primer lugar hay que exportar los metadatos del archivo en cuestión. El comando

pdftk file.pdf dump_data output metadata

generará metadataun archivo que contiene todos los metadatos de file.pdf. Dentro de este archivo encontrará estructuras de la siguiente forma:

...
InfoBegin
InfoKey: Creator
InfoValue: pdftk 3.0.2 - www.pdftk.com
...

Puede crear su propia clave de metadatos agregando las líneas

InfoBegin
InfoKey: Hyperlink
InfoValue: [email protected]

al archivo. Finalmente, necesitas actualizar los metadatos de file.pdfcon

pdftk file.pdf update_info metadata output file2.pdf

Tenga en cuenta que este último genera un nuevo archivo file2.pdf. Ahora tiene dos archivos: file1.pdfsin los metadatos agregados y file2.pdfcon su clave de metadatos personalizada. Puedes comprobar si todo salió bien con el exiftoolcomando que devuelve

...
Hyperlink                       : [email protected]
Modify Date                     : 2019:10:08 18:42:36+02:00
Creator                         : pdftk 3.0.2 - www.pdftk.com
Create Date                     : 2019:10:08 18:42:36+02:00
...

Respuesta2

Puedes usar pdftk para eliminar toda la información y los metadatos XMP de un documento copiando sus páginas en un nuevo PDF, como este:

pdftk A=mydoc.pdf cat A salida mydoc.no_metadata.pdf

información relacionada