pdf 中的 OCR 和圖層文本

pdf 中的 OCR 和圖層文本

我想對 pdf 進行 OCR 使其可搜尋。

假設您有一個使用掃描器製作的 PDF 文檔,或包含圖像資料但沒有文字資料。 PDF 閱讀器或桌面搜尋應用程式無法搜尋此類 PDF。 pdfocr 是我製作的一個簡單實用程序,它獲取PDF 文件,然後生成一個添加了文本層的新文件,因此您的PDF 閱讀器可以搜索該文件,並且可以通過桌面搜索應用程序對其進行索引,但列印時仍然相同。

操作方法:使用 pdfocr 使掃描的 PDF 可搜尋 (OCR)

目前,像 FreeOCR 這樣的 Windows 軟體只能從 pdf 產生 TXT 文件,但我只想要原始 pdf可搜尋的

答案1

Adobe Acrobat 具有您所提及的功能。在 Acrobat 10/11 中,此功能位於工具的「識別文字」部分下(請參閱官方文檔)。舊版中提供了相同的功能,但存取方式略有不同(請參閱Adobe 的博客)。

您可以單獨對任何或所有頁面執行 OCR,並且在應用 OCR 後 PDF 顯示相同(但隨後可搜尋)。

相關內容