La extracción de imágenes incrustadas de un PDF da como resultado pequeñas rayas

La extracción de imágenes incrustadas de un PDF da como resultado pequeñas rayas

Tengo un pdf importante donde necesito extraer la imagen de origen, con la menor pérdida posible (por ejemplo, usando png). Por alguna razón, parece que la imagen de origen está hecha de 226 franjas de imágenes, y cuando las extraigo, por ejemplo, con

pdfimages -png name.pdf out-

Obtengo las 227 rayas pequeñas. Eso no es lo que quiero. ¿Hay alguna manera de obtener una sola imagen? Usandolista de imágenes pdfme dice la información sobre las rayas y usa, por ejemplo, lo anteriorpdfimages -png nombre.pdf salida-me da las 227 imágenes individuales. Una imagen tiene, por ejemplo, 1604 px de ancho y 5 px de alto. Hasta donde las revisé, todas las imágenes parecen tener una altura de 5 px, y con 227 imágenes individuales, debería obtener una sola imagen de 1604 x 1135 px.

Actualizar Olvidé agregar que lo que Ryan J. Yoder escribió a continuación también fue mi propio pensamiento sobre el tema, lo que significa que el pdf se creó dividiendo la imagen original en 227 franjas.

Y en conclusión, si eso es así (lista de imágenes pdfdice que es así) ¿hay alguna manera de crear automáticamente una sola imagen a partir de las franjas, por ejemplo, usando Graphicsmagick?

Respuesta1

Ghostscript se puede utilizar para obtener imágenes de las páginas tal como aparecen en un visor, por ejemplo, para .pngimágenes con 300 ppp denominadas out_001.png, out_002.png, … de in.pdf:

gs -q -dBATCH -dNOPAUSE -sDEVICE=png16m -r300 -sOutputFile=out_%03d.png in.pdf

Respuesta2

Puede usar ImageMagick para 'convertir' el PDF a png usando la línea de comando:

convert -density 300 page.pdf page.png

o cualquier densidad (DPI) que desees.

información relacionada