Exporte todos los archivos PDF como texto con Adobe Acrobar Pro DC

Exporte todos los archivos PDF como texto con Adobe Acrobar Pro DC

Pregunta:¿Cómo consigo que Adobe Acrobat Pro DC exporte todos los archivos PDF de una carpeta como archivos de texto?

Usando el Asistente de acción en el menú Herramientas de Adobe Acrobat Pro DC pude crear un comando personalizado que me permitió exportar (OCR) miles de imágenes como archivos pdf. Ahora quiero exportar esas imágenes; que ahora se pueden buscar como archivos de texto. Sin embargo, parece que no puedo encontrar un conjunto similar de herramientas para hacer esto.

Nota: Hay un botón de exportación que me permite exportar archivos uno a la vez como un archivo de texto, pero parece que no puedo encontrar algo que me permita ejecutar un comando en toda la carpeta.

EDITAR: Llamé a atención al cliente y una posible solución es combinar todos los archivos en un archivo PDF gigante y luego exportar el archivo pdf. Por otro lado, necesito una identificación separada para cada archivo pdf exportado como texto, por lo que esa no es una opción.

Respuesta1

Puede utilizar PowerShell combinado conxpdf.

Xpdf instalará un programa llamado pdftotext, que se puede invocar desde un script de PowerShell como:

$FILES= ls *.pdf
foreach ($f in $FILES) {
    & "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "$f"
}

Se puede invocar un script por lotes similar desde un .batarchivo sin usar PowerShell:

for /f %%G in ('dir /b') do {
  "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "%%G"
)

(Nota: Ninguno de los scripts fue probado).

información relacionada