Вопрос:Как заставить Adobe Acrobat Pro DC экспортировать все PDF-файлы в папке как текстовые файлы?
Используя Мастер действий в меню Инструменты Adobe Acrobat Pro DC, я смог создать пользовательскую команду, которая позволила мне экспортировать (OCR) тысячи изображений в виде файлов PDF. Теперь я хочу экспортировать эти изображения; теперь они доступны для поиска как текстовые файлы. Однако я не могу найти похожий набор инструментов для этого.
Примечание: есть кнопка экспорта, которая позволяет мне экспортировать файлы по одному в виде текстового файла, но я не могу найти ничего, что позволило бы мне выполнить команду для всей папки.
EDIT: Я позвонил в службу поддержки клиентов, и возможным решением будет объединить все файлы в один гигантский файл PDF, а затем экспортировать файл PDF. С другой стороны, мне нужен отдельный идентификатор для каждого файла PDF, экспортируемого как текст, так что это не вариант.
решение1
Вы можете использовать PowerShell в сочетании сXpdf.
Xpdf установит программу под названием pdftotext
, которую можно вызвать из скрипта PowerShell, например:
$FILES= ls *.pdf
foreach ($f in $FILES) {
& "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "$f"
}
Похожий пакетный скрипт можно вызвать из .bat
файла без использования PowerShell:
for /f %%G in ('dir /b') do {
"C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "%%G"
)
(Примечание: ни один из сценариев не тестировался.)