%20sobre%20uma%20imagem%20digitalizada.png)
Tenho um PDF que consiste em imagens digitalizadas de páginas de um livro impresso antigo. (Não foi OCR, portanto não é pesquisável.) Usando o GoogleAPI Cloud Vision, pode-se realizar o OCR e, o que é mais interessante, obter a posição da (caixa delimitadora de) cada palavra. Agora, usando TeX/LaTeX (com qualquer mecanismo),existe uma maneira de adicionar essas palavras ao PDF nas posições correspondentes, ou seja, adicionar manualmente uma camada de OCR/texto (invisível) ao PDF de forma que ainda seja a imagem digitalizada visível, mas o texto possa ser selecionado e copiado?
(Eu percebo que como não estamos usando nenhum dos recursos de documentos estruturados do LaTeX, nem nenhum dos recursos de composição tipográfica do TeX - quebrando parágrafos em linhas, fazendo kerning etc. - e estamos posicionando manualmente o texto que nem será visível, pode parecer que O TeX não é realmente necessário para este trabalho, mas também não conheço nenhuma outra ferramenta: existem ferramentas como tesseract
essa que fazem OCR e adicionam o texto automaticamente, mas eu quero controle, para poder escolher qual texto vai para onde. uma maneira de fazer isso dentro do TeX/XeTeX/LuaTeX.)
Responder1
Você pode usar o pacote transparente para tornar o texto transparente. Copiar e colar deve funcionar bem, mas encontrar o texto para copiar é um pouco mais difícil ;-) transparente atualmente funciona com pdflatex e lualatex, no próximo texto ao vivo também funcionará com (x)dvipdfmx.
\documentclass{article}
\usepackage{pdfpages,transparent}
\usepackage{eso-pic}
\AddToShipoutPictureFG{\AtPageCenter{\texttransparent{0}{\Huge This is some text in the center}}}
\begin{document}
\includepdf[pages=1]{example-image-a}
\end{document}