使用 Adob​​e Acrobar Pro DC 將所有 PDF 檔案匯出為文字

使用 Adob​​e Acrobar Pro DC 將所有 PDF 檔案匯出為文字

問題:如何讓 Adob​​e Acrobat Pro DC 將資料夾中的所有 PDF 檔案匯出為文字檔案?

使用 Adob​​e Acrobat Pro DC 工具選單上的操作嚮導,我能夠建立自訂命令,該命令允許我將數千張圖像匯出(OCR)為 pdf 檔案。我現在想導出這些圖像;現在可以作為文字檔案進行搜尋。然而我似乎找不到一套類似的工具來做到這一點。

注意:有一個匯出按鈕允許我一次將文件匯出為文字文件,但我似乎找不到允許我在整個資料夾上運行命令的東西。

編輯:我致電客戶支持,一種可能的解決方法是將所有文件合併為一個巨大的 PDF 文件,然後匯出 pdf 文件。另一方面,我需要為每個匯出為文字的 pdf 檔案提供一個單獨的 ID,因此這不是一個選項。

答案1

您可以結合使用 PowerShellXpdf

Xpdf 將安裝一個名為 的程序pdftotext,可以從 PowerShell 腳本呼叫該程序,例如:

$FILES= ls *.pdf
foreach ($f in $FILES) {
    & "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "$f"
}

可以從檔案呼叫類似的批次腳本,.bat而無需使用 PowerShell:

for /f %%G in ('dir /b') do {
  "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "%%G"
)

(注意:沒有測試任何腳本。)

相關內容