在掃描影像上手動新增文字圖層 (OCR)

在掃描影像上手動新增文字圖層 (OCR)

我有一個 PDF 文件,其中包含一本舊印刷書籍的頁面掃描圖像。 (它尚未經過 OCRed,因此無法搜尋。)使用 Google雲端視覺API,可以執行 OCR,更有趣的是,取得每個單字(邊界框)的位置。現在,使用 TeX/LaTeX(使用任何引擎),有沒有辦法將這些單字加入PDF的相應位置,即手動向 PDF 添加(不可見)OCR/文字圖層,使其仍然是可見的掃描圖像,但可以選擇和複製文字?

(我意識到,由於我們沒有使用任何 LaTeX 的結構化文件功能,也沒有使用任何 TeX 的排版功能(將段落分成行、進行字距調整等)並且手動定位甚至不可見的文本,因此看起來可能這項工作實際上並不需要TeX,但我也不知道任何其他工具:有類似的工具可以tesseract自動進行 OCR 並添加文本,但我想要控制,以便能夠選擇文本的位置。 /LuaTeX 內部完成此操作的方法。

答案1

您可以使用透明包使文字透明。複製和貼上應該可以正常工作,但是找到要複製的文字有點困難;-) 透明目前適用於 pdflatex 和 lualatex,在下一個文字即時中它也將適用於 (x)dvipdfmx。

\documentclass{article}
\usepackage{pdfpages,transparent}
\usepackage{eso-pic}

\AddToShipoutPictureFG{\AtPageCenter{\texttransparent{0}{\Huge This is some text in the center}}}
\begin{document}
\includepdf[pages=1]{example-image-a}
\end{document}

在此輸入影像描述

相關內容