Tengo un archivo PDF que es un escaneo de un formulario que contiene imágenes, tablas y texto.
Me gustaría ejecutar un programa (no una herramienta en línea) en el archivo y hacer que genere un archivo txt que contenga las palabras. No te preocupas demasiado por el formato.
Tenga en cuenta que esto no es una repetición de 'Convertir pdf a texto ignorando la estructura', ya que se refiere a texto en documentos PDF directos, no a imágenes escaneadas almacenadas como PDF.