將圖像檔案中的文字轉換為文字文件

將圖像檔案中的文字轉換為文字文件

我有一個 PDF 文件,它是包含圖片、表格和文字的表單的掃描件。

我想在該文件上運行一個程式(不是線上工具)並讓它產生一個包含這些單字的 txt 檔案。不太關心格式。

請注意,這不是「將 pdf 轉換為文本忽略結構」的重複,因為它指的是直接 PDF 文件中的文本,而不是儲存為 PDF 的掃描圖像。

相關內容