Beim Extrahieren eingebetteter Bilder aus einer PDF-Datei entstehen winzige Streifen

Beim Extrahieren eingebetteter Bilder aus einer PDF-Datei entstehen winzige Streifen

Ich habe ein wichtiges PDF, aus dem ich das Quellbild möglichst verlustfrei extrahieren muss (z. B. mit PNG). Aus irgendeinem Grund scheint das Quellbild aus 226 Bildstreifen zu bestehen, und wenn ich diese extrahiere, z. B. mit

pdfimages -png name.pdf out-

Ich bekomme die 227 winzigen Streifen. Das ist nicht das, was ich will. Gibt es eine Möglichkeit, stattdessen ein einzelnes Bild zu erhalten? Mitpdfimages -listsagt mir die Informationen über die Streifen, und mit zB die obenpdfimages -png name.pdf Ausgabe-gibt mir die 227 Einzelbilder. Ein Bild ist z. B. 1604 Pixel breit und 5 Pixel hoch. Soweit ich sie überprüft habe, scheinen alle Bilder 5 Pixel hoch zu sein, und mit 227 Einzelbildern sollte ich stattdessen ein Einzelbild von 1604 x 1135 Pixel erhalten.

Aktualisieren Ich habe vergessen hinzuzufügen, dass das, was Ryan J. Yoder unten geschrieben hat, auch meine eigene Meinung zu diesem Thema war, d. h. dass das PDF tatsächlich durch Aufteilen des Originalbilds in 227 Streifen erstellt wurde.

Und abschließend: Wenn das so ist (pdfimages -listsagt, dass es so ist) gibt es eine Möglichkeit, automatisch ein einzelnes Bild aus den Streifen zu erstellen, z. B. mit GraphicsMagick.

Antwort1

Mit Ghostscript können Bilder der Seiten so abgerufen werden, wie sie in einem Viewer angezeigt werden, z. B. für .pngBilder mit 300 dpi mit den Namen out_001.png, out_002.png, … von in.pdf:

gs -q -dBATCH -dNOPAUSE -sDEVICE=png16m -r300 -sOutputFile=out_%03d.png in.pdf

Antwort2

Sie können ImageMagick verwenden, um das PDF über die Befehlszeile in ein PNG zu „konvertieren“:

convert -density 300 page.pdf page.png

oder welche Dichte (DPI) Sie auch immer möchten.

verwandte Informationen