Экспорт всех файлов PDF в текстовом формате с помощью Adobe Acrobar Pro DC

Экспорт всех файлов PDF в текстовом формате с помощью Adobe Acrobar Pro DC

Вопрос:Как заставить Adobe Acrobat Pro DC экспортировать все PDF-файлы в папке как текстовые файлы?

Используя Мастер действий в меню Инструменты Adobe Acrobat Pro DC, я смог создать пользовательскую команду, которая позволила мне экспортировать (OCR) тысячи изображений в виде файлов PDF. Теперь я хочу экспортировать эти изображения; теперь они доступны для поиска как текстовые файлы. Однако я не могу найти похожий набор инструментов для этого.

Примечание: есть кнопка экспорта, которая позволяет мне экспортировать файлы по одному в виде текстового файла, но я не могу найти ничего, что позволило бы мне выполнить команду для всей папки.

EDIT: Я позвонил в службу поддержки клиентов, и возможным решением будет объединить все файлы в один гигантский файл PDF, а затем экспортировать файл PDF. С другой стороны, мне нужен отдельный идентификатор для каждого файла PDF, экспортируемого как текст, так что это не вариант.

решение1

Вы можете использовать PowerShell в сочетании сXpdf.

Xpdf установит программу под названием pdftotext, которую можно вызвать из скрипта PowerShell, например:

$FILES= ls *.pdf
foreach ($f in $FILES) {
    & "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "$f"
}

Похожий пакетный скрипт можно вызвать из .batфайла без использования PowerShell:

for /f %%G in ('dir /b') do {
  "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "%%G"
)

(Примечание: ни один из сценариев не тестировался.)

Связанный контент