問題:如何讓 Adobe Acrobat Pro DC 將資料夾中的所有 PDF 檔案匯出為文字檔案?
使用 Adobe Acrobat Pro DC 工具選單上的操作嚮導,我能夠建立自訂命令,該命令允許我將數千張圖像匯出(OCR)為 pdf 檔案。我現在想導出這些圖像;現在可以作為文字檔案進行搜尋。然而我似乎找不到一套類似的工具來做到這一點。
注意:有一個匯出按鈕允許我一次將文件匯出為文字文件,但我似乎找不到允許我在整個資料夾上運行命令的東西。
編輯:我致電客戶支持,一種可能的解決方法是將所有文件合併為一個巨大的 PDF 文件,然後匯出 pdf 文件。另一方面,我需要為每個匯出為文字的 pdf 檔案提供一個單獨的 ID,因此這不是一個選項。
答案1
您可以結合使用 PowerShellXpdf。
Xpdf 將安裝一個名為 的程序pdftotext
,可以從 PowerShell 腳本呼叫該程序,例如:
$FILES= ls *.pdf
foreach ($f in $FILES) {
& "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "$f"
}
可以從檔案呼叫類似的批次腳本,.bat
而無需使用 PowerShell:
for /f %%G in ('dir /b') do {
"C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "%%G"
)
(注意:沒有測試任何腳本。)