
He sido bendecido en el contexto de que muchas veces, si me encuentro con algún contenido interesante, debate, etc. que involucra algún pdf, la mayoría de las veces el autor me envía el contenido/pdf por correo o me envía el mismo por mensajería instantánea o lo que sea. . Con el tiempo, olvido el contexto o quién me envió el contenido. Si bien no conozco los límites, estoy bastante seguro de que se pueden agregar al menos un par de campos. Por ejemplo, aquí hay metadatos de un archivo pdf que estoy viendo actualmente.
File Size : 3.6 MB
File Modification Date/Time : 2019:11:24 01:11:52+05:30
File Access Date/Time : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time : 2019:11:24 01:11:54+05:30
File Permissions : rw-r--r--
File Type : PDF
File Type Extension : pdf
MIME Type : application/pdf
PDF Version : 1.4
Linearized : No
Page Count : 54
Producer : Mac OS X 10.11.6 Quartz PDFContext
Creator : LaTeX with hyperref package
Create Date : 2018:05:01 19:56:31Z
Modify Date : 2018:05:01 19:56:31Z
Ahora pregunto una forma en la que podría agregar campos como hipervínculo (para poder recordar de dónde descargué el archivo específico) o para poder saber/consultar o descubrir incluso en una fecha posterior quién compartió el contenido/archivo pdf. conmigo. Vi la página de manual de pdftk o más bien pdftk-java que está en Debian. Hay algo que se llama , pero el ejemplo compartido no me facilita entender cómo se supone que se debe usar. ¿Alguien podría ayudar?from : [email protected]
update_info
Respuesta1
En primer lugar hay que exportar los metadatos del archivo en cuestión. El comando
pdftk file.pdf dump_data output metadata
generará metadata
un archivo que contiene todos los metadatos de file.pdf
. Dentro de este archivo encontrará estructuras de la siguiente forma:
...
InfoBegin
InfoKey: Creator
InfoValue: pdftk 3.0.2 - www.pdftk.com
...
Puede crear su propia clave de metadatos agregando las líneas
InfoBegin
InfoKey: Hyperlink
InfoValue: [email protected]
al archivo. Finalmente, necesitas actualizar los metadatos de file.pdf
con
pdftk file.pdf update_info metadata output file2.pdf
Tenga en cuenta que este último genera un nuevo archivo file2.pdf
. Ahora tiene dos archivos: file1.pdf
sin los metadatos agregados y file2.pdf
con su clave de metadatos personalizada. Puedes comprobar si todo salió bien con el exiftool
comando que devuelve
...
Hyperlink : [email protected]
Modify Date : 2019:10:08 18:42:36+02:00
Creator : pdftk 3.0.2 - www.pdftk.com
Create Date : 2019:10:08 18:42:36+02:00
...
Respuesta2
Puedes usar pdftk para eliminar toda la información y los metadatos XMP de un documento copiando sus páginas en un nuevo PDF, como este:
pdftk A=mydoc.pdf cat A salida mydoc.no_metadata.pdf