
Fui abençoado no contexto de que, muitas vezes, se me deparo com algum conteúdo interessante, debate etc. que envolva algum PDF, na maioria das vezes o autor me envia o conteúdo/pdf pelo correio ou me envia o mesmo por mensagem instantânea ou qualquer outra coisa . Com o passar do tempo, esqueço o contexto ou quem me enviou o conteúdo. Embora eu não conheça os limites, tenho certeza de que pelo menos alguns campos podem ser adicionados. Por exemplo, aqui estão os metadados de um arquivo PDF que estou visualizando atualmente.
File Size : 3.6 MB
File Modification Date/Time : 2019:11:24 01:11:52+05:30
File Access Date/Time : 2019:11:24 01:12:00+05:30
File Inode Change Date/Time : 2019:11:24 01:11:54+05:30
File Permissions : rw-r--r--
File Type : PDF
File Type Extension : pdf
MIME Type : application/pdf
PDF Version : 1.4
Linearized : No
Page Count : 54
Producer : Mac OS X 10.11.6 Quartz PDFContext
Creator : LaTeX with hyperref package
Create Date : 2018:05:01 19:56:31Z
Modify Date : 2018:05:01 19:56:31Z
Agora pergunto uma maneira de adicionar campos como hiperlink (para que eu possa lembrar de onde baixei o arquivo específico) ou para que eu sempre possa saber/referir-se ou descobrir mesmo posteriormente quem compartilhou o conteúdo/arquivo pdf Comigo. Eu vi a página de manual do pdftk ou melhor, pdftk-java que existe no Debian. Existe algo chamado, mas o exemplo compartilhado não facilita a compreensão de como alguém deve usá-lo. Alguém poderia ajudar?from : [email protected]
update_info
Responder1
Em primeiro lugar é necessário exportar os metadados do arquivo em questão. O comando
pdftk file.pdf dump_data output metadata
irá gerar metadata
um arquivo contendo todos os metadados de file.pdf
. Dentro deste arquivo você encontrará estruturas do seguinte formato:
...
InfoBegin
InfoKey: Creator
InfoValue: pdftk 3.0.2 - www.pdftk.com
...
Você pode criar sua própria chave de metadados adicionando as linhas
InfoBegin
InfoKey: Hyperlink
InfoValue: [email protected]
para o arquivo. Finalmente, você precisa atualizar os metadados de file.pdf
com
pdftk file.pdf update_info metadata output file2.pdf
Observe que este último gera um novo arquivo file2.pdf
. Agora você tem dois arquivos: file1.pdf
sem os metadados adicionados e file2.pdf
com sua chave de metadados personalizada. Você pode verificar se tudo correu bem com o exiftool
comando que retorna
...
Hyperlink : [email protected]
Modify Date : 2019:10:08 18:42:36+02:00
Creator : pdftk 3.0.2 - www.pdftk.com
Create Date : 2019:10:08 18:42:36+02:00
...
Responder2
Você pode usar o pdftk para remover todos os metadados Info e XMP de um documento, copiando suas páginas em um novo PDF, como este:
pdftk A = meudoc.pdf cat A saída mydoc.no_metadata.pdf