스캔한 이미지 위에 수동으로 텍스트 레이어(OCR) 추가

스캔한 이미지 위에 수동으로 텍스트 레이어(OCR) 추가

오래된 인쇄된 책의 페이지를 스캔한 이미지로 구성된 PDF가 있습니다. (OCR처리가 되어 있지 않아 검색이 불가능합니다.) Google을 이용하여클라우드 비전 API, OCR을 수행할 수 있으며 더 흥미로운 점은 각 단어의 경계 상자 위치를 가져오는 것입니다. 이제 TeX/LaTeX(모든 엔진 포함)를 사용하여PDF의 해당 위치에 이 단어를 추가하는 방법이 있나요?, 즉 스캔한 이미지는 여전히 보이지만 텍스트를 선택하고 복사할 수 있도록 (보이지 않는) OCR/텍스트 레이어를 PDF에 수동으로 추가하시겠습니까?

(나는 우리가 LaTeX의 구조화된 문서 기능이나 TeX의 조판 기능(문단을 줄로 나누기, 커닝 등)을 사용하지 않고 심지어 보이지도 않을 텍스트의 위치를 ​​수동으로 지정하기 때문에 다음과 같이 보일 수 있다는 것을 알고 있습니다. TeX는 이 작업에 실제로 필요하지 않습니다. 하지만 다른 도구도 모릅니다. tesseract자동으로 OCR을 수행하고 텍스트를 추가하는 도구가 있지만, 어떤 텍스트가 어디로 갈지 선택할 수 있도록 제어하고 싶습니다. TeX/XeTeX/LuaTeX 내에서 이를 수행하는 방법입니다.)

답변1

transparent 패키지를 사용하여 텍스트를 투명하게 만들 수 있습니다. 복사 및 붙여넣기는 잘 작동하지만 복사할 텍스트를 찾는 것이 좀 더 어렵습니다. ;-) transparent는 현재 pdflatex 및 lualatex에서 작동하며, 다음 텍스트 라이브에서는 (x)dvipdfmx에서도 작동할 것입니다.

\documentclass{article}
\usepackage{pdfpages,transparent}
\usepackage{eso-pic}

\AddToShipoutPictureFG{\AtPageCenter{\texttransparent{0}{\Huge This is some text in the center}}}
\begin{document}
\includepdf[pages=1]{example-image-a}
\end{document}

여기에 이미지 설명을 입력하세요

관련 정보