Adobe Acrobar Pro DCを使用してすべてのPDFファイルをテキストとしてエクスポートする

Adobe Acrobar Pro DCを使用してすべてのPDFファイルをテキストとしてエクスポートする

質問:Adobe Acrobat Pro DC を使用して、フォルダー内のすべての PDF ファイルをテキスト ファイルとしてエクスポートするにはどうすればよいですか?

Adobe Acrobat Pro DC のツール メニューのアクション ウィザードを使用して、数千枚の画像を PDF ファイルとしてエクスポート (OCR) できるカスタム コマンドを作成することができました。これらの画像をエクスポートして、テキスト ファイルとして検索できるようにしたいのですが、これを行うための同様のツール セットが見つからないようです。

注: ファイルを 1 つずつテキスト ファイルとしてエクスポートできるエクスポート ボタンはありますが、フォルダー全体に対してコマンドを実行できるボタンは見つからないようです。

編集: カスタマー サポートに電話したところ、すべてのファイルを 1 つの巨大な PDF ファイルに結合して、その PDF ファイルをエクスポートするという回避策が考えられました。ただし、テキストとしてエクスポートされた PDF ファイルごとに個別の ID が必要なので、これは選択肢ではありません。

答え1

PowerShellと組み合わせて使用​​​​することもできますXpdf

Xpdf は というプログラムをインストールしますpdftotext。このプログラムは次のような PowerShell スクリプトから呼び出すことができます。

$FILES= ls *.pdf
foreach ($f in $FILES) {
    & "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "$f"
}

同様のバッチ スクリプトは、.batPowerShell を使用せずにファイルから呼び出すことができます。

for /f %%G in ('dir /b') do {
  "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "%%G"
)

(注: いずれのスクリプトもテストされていません。)

関連情報