Adicionar manualmente uma camada de texto (OCR) sobre uma imagem digitalizada

Adicionar manualmente uma camada de texto (OCR) sobre uma imagem digitalizada

Tenho um PDF que consiste em imagens digitalizadas de páginas de um livro impresso antigo. (Não foi OCR, portanto não é pesquisável.) Usando o GoogleAPI Cloud Vision, pode-se realizar o OCR e, o que é mais interessante, obter a posição da (caixa delimitadora de) cada palavra. Agora, usando TeX/LaTeX (com qualquer mecanismo),existe uma maneira de adicionar essas palavras ao PDF nas posições correspondentes, ou seja, adicionar manualmente uma camada de OCR/texto (invisível) ao PDF de forma que ainda seja a imagem digitalizada visível, mas o texto possa ser selecionado e copiado?

(Eu percebo que como não estamos usando nenhum dos recursos de documentos estruturados do LaTeX, nem nenhum dos recursos de composição tipográfica do TeX - quebrando parágrafos em linhas, fazendo kerning etc. - e estamos posicionando manualmente o texto que nem será visível, pode parecer que O TeX não é realmente necessário para este trabalho, mas também não conheço nenhuma outra ferramenta: existem ferramentas como tesseractessa que fazem OCR e adicionam o texto automaticamente, mas eu quero controle, para poder escolher qual texto vai para onde. uma maneira de fazer isso dentro do TeX/XeTeX/LuaTeX.)

Responder1

Você pode usar o pacote transparente para tornar o texto transparente. Copiar e colar deve funcionar bem, mas encontrar o texto para copiar é um pouco mais difícil ;-) transparente atualmente funciona com pdflatex e lualatex, no próximo texto ao vivo também funcionará com (x)dvipdfmx.

\documentclass{article}
\usepackage{pdfpages,transparent}
\usepackage{eso-pic}

\AddToShipoutPictureFG{\AtPageCenter{\texttransparent{0}{\Huge This is some text in the center}}}
\begin{document}
\includepdf[pages=1]{example-image-a}
\end{document}

insira a descrição da imagem aqui

informação relacionada