У меня есть pdf-каталог, который мне дал клиент в формате pdf. У них нет изображений, но они есть в pdf.
Есть ли способ извлечь все изображения из PDF-файла с помощью инструмента командной строки, сохранив при этом исходные имена файлов?
Я рассмотрел этот вопрос здесь:Извлечение изображений из PDF с помощью масок слоев но это для отдельных изображений.
решение1
Программа pdfimages
из пакета poppler-utils
может быть тем, что вы ищете. Из man-страницы:
Pdfimages считывает PDF-файл PDF-файл, сканирует одну или несколько страниц и записывает один файл PPM, PBM или JPEG для каждого изображения.
В более новых версияхв poppler-utils есть all
переключатель для извлечения в jpg или png:
pdfimages -all input.pdf images/prefix
выведет файлы в видепрефикс-nnn.[png|jpg]визображенийпапка.