¿Exportar comentarios de Adobe Acrobat de un PDF a un archivo de texto?

¿Exportar comentarios de Adobe Acrobat de un PDF a un archivo de texto?

Tengo muchos archivos PDF con cientos de anotaciones/comentarios, creados a través del Adobe Acrobat Reader gratuito. Leyendoesta guía oficial, y hojeando las páginas relacionadas, veo que puedo "exportar" los comentarios en archivos FDF o formato XFDF.

Sin embargo, estos archivos no se pueden abrir solos sin el original, desde el primer enlace:

No puede abrir ni ver archivos FDF o XFDF por sí solos.

Me gustaría exportar los comentarios como un archivo de texto que contenga solo el texto de los comentarios.

Respuesta1

Esto es un poco complicado, pero funciona.
Siga las instrucciones aquí para exportar los comentarios y exportarlos a unXFDFarchivo:

  1. Cambie el nombre de la extensión del archivo a XML (es decir, si el nombre del archivo era "comments.xfdf", cambie su nombre a "comments.xml".

  2. Abra el archivo XML usando Google Chrome.

  3. Seleccione todo ( Ctrl+ A) y luego copie ( Ctrl+ C).

  4. Abra una nueva ventana de Chrome y navegue hasta este enlace (crea un bloc de notas en blanco):

     data:text/html,%20<html%20contenteditable>
    
  5. Haga clic en el área blanca y pegue ( Ctrl+ V).

  6. Seleccionar todo (sí, de nuevo, Ctrl+ A).

  7. Copiar ( Ctrl+ C).

  8. Pegar en un documento de Word.

Nota:Puede que funcione con otros navegadores, pero al menos para mí, al copiar y pegar desde Firefox, terminaría con todo el código XML en Word.

Respuesta2

  • Abra el archivo fdf en Notepad++

  • Reemplazar <body[^>]*>(.*?)<\/body>con 22222\133333(no olvide configurar el modo de búsqueda como expresión regular y "coincide con nueva línea")

  • Poner 33333al principio del documento.

  • Poner 22222al final del documento.

  • Reemplazar 33333(.*?)22222con una cadena vacía

  • Guarde el archivo como documento .html, ábralo en el navegador

  • ¡Voilá!

33333 y 22222 pueden ser cualquier secuencia siempre que no aparezca en tus comentarios.

información relacionada