Tenho um catálogo em pdf que me foi fornecido por um cliente em formato pdf. Não têm as imagens mas estão no pdf.
Existe uma maneira de extrair todas as imagens de um PDF usando uma ferramenta de linha de comando, preservando os nomes dos arquivos originais?
Eu revisei esta questão aqui:Extraia imagens de PDF com máscaras de camada mas é para imagens individuais.
Responder1
O programa pdfimages
do pacote poppler-utils
pode ser o que você está procurando. Na página de manual:
Pdfimages lê o arquivo PDF arquivo PDF, digitaliza uma ou mais páginas e grava um arquivo PPM, PBM ou JPEG para cada imagem.
Em versões mais recentesdo poppler-utils existe uma all
opção para extrair para jpg ou png:
pdfimages -all input.pdf images/prefix
produzirá arquivos no formatoprefixo-nnn.[png|jpg]noimagenspasta.