У меня есть важный PDF-файл, из которого мне нужно извлечь исходное изображение, насколько это возможно без потерь (например, с помощью png). По какой-то причине кажется, что исходное изображение состоит из 226 полос изображения, и когда я извлекаю их, например, с помощью
pdfimages -png name.pdf out-
Я получаю 227 маленьких полосок. Это не то, что мне нужно. Есть ли способ получить одно изображение вместо этого? Используяpdfimages-списоксообщает мне информацию о полосках, и используя, например, вышеpdfimages -png имя.pdf out-дает мне 227 отдельных изображений. Одно изображение имеет ширину 1604 пикселей и высоту 5 пикселей. Насколько я их проверил, все изображения имеют высоту 5 пикселей, и с 227 отдельными изображениями я должен получить одно изображение размером 1604 x 1135 пикселей.
Обновлять Я забыл добавить, что написанное ниже Райаном Дж. Йодером также является моим собственным мнением по этому вопросу, а это значит, что PDF-файл действительно был создан путем разделения исходного изображения на 227 полос.
И в заключение, если это так (pdfimages-списокговорит, что это так) есть ли способ автоматически создать одно изображение из полос, например, с помощью graphicsmagick.
решение1
Ghostscript можно использовать для получения изображений страниц в том виде, в котором они отображаются в средстве просмотра, например, для .png
изображений с разрешением 300 точек на дюйм с именами out_001.png
, out_002.png
, … из in.pdf
:
gs -q -dBATCH -dNOPAUSE -sDEVICE=png16m -r300 -sOutputFile=out_%03d.png in.pdf
решение2
Вы можете использовать ImageMagick для «конвертации» PDF в png с помощью командной строки:
convert -density 300 page.pdf page.png
или любую плотность (DPI), которую вы пожелаете.