Agregar manualmente una capa de texto (OCR) sobre una imagen escaneada

Agregar manualmente una capa de texto (OCR) sobre una imagen escaneada

Tengo un PDF que consta de imágenes escaneadas de páginas de un libro impreso antiguo. (No se ha realizado OCR, por lo que no se puede realizar búsquedas). Uso de GoogleAPI de visión en la nube, se puede realizar OCR y, lo que es más interesante, obtener la posición del (cuadro delimitador para) cada palabra. Ahora, usando TeX/LaTeX (con cualquier motor),¿Hay alguna manera de agregar estas palabras al PDF en las posiciones correspondientes?, es decir, ¿agregar manualmente una capa de texto/OCR ​​(invisible) al PDF de modo que la imagen escaneada siga siendo visible pero el texto se pueda seleccionar y copiar?

(Me doy cuenta de que como no estamos usando ninguna de las funciones de documentos estructurados de LaTeX, ni ninguna de las funciones de composición tipográfica de TeX (dividir párrafos en líneas, hacer interletraje, etc.) y estamos posicionando manualmente texto que ni siquiera será visible, puede parecer que TeX realmente no es necesario para este trabajo. Pero tampoco conozco ninguna otra herramienta: hay herramientas como tesseractesa que hacen OCR automáticamente y agregan el texto, pero quiero tener control para poder elegir qué texto va y dónde. una forma de hacerlo desde TeX/XeTeX/LuaTeX.)

Respuesta1

Puede utilizar el paquete transparente para hacer que el texto sea transparente. Copiar y pegar debería funcionar bien, pero encontrar el texto a copiar es un poco más difícil ;-) transparent actualmente funciona con pdflatex y lualatex, en el próximo texto en vivo también funcionará con (x)dvipdfmx.

\documentclass{article}
\usepackage{pdfpages,transparent}
\usepackage{eso-pic}

\AddToShipoutPictureFG{\AtPageCenter{\texttransparent{0}{\Huge This is some text in the center}}}
\begin{document}
\includepdf[pages=1]{example-image-a}
\end{document}

ingrese la descripción de la imagen aquí

información relacionada