
PDF を OCR して検索可能にしたいです。
スキャナを使用して作成された、または画像データで構成され、テキスト データがない PDF ドキュメントがあるとします。このような PDF は、PDF リーダーやデスクトップ検索アプリケーションで検索できません。pdfocr は、私が作成したシンプルなユーティリティで、PDF ファイルを受け取り、テキスト レイヤーが追加された新しいファイルを生成します。この新しいファイルは、PDF リーダーで検索でき、デスクトップ検索アプリケーションでインデックスを作成できますが、印刷してもまったく同じです。
から方法: pdfocr を使用してスキャンした PDF を検索可能 (OCR) にする
現在、FreeOCRのようなWindowsソフトウェアはPDFからTXTファイルのみを作成しますが、私は元のPDFのみが欲しいのです。検索可能。