Warum sind die von pdfimages erstellten Bilder bei Verwendung des Flags -all anders?

Question

pdfimages -allgibt dengenauDatei, die im PDF gespeichert war.

Wir können dies testen, indem wir einen Roundtrip durchführen: Wir beginnen mit einem JPG-Bild, fügen es mit LaTeX zu einem PDF hinzu, extrahieren es mit pdfimages -allund vergleichen es dann mit dem Original. (Der Grund für die Verwendung von LaTeX wird später erklärt.)

Ich habe das erste JPG-Bild, das ich aus Ihrem Link extrahiert habe, und habe es benannt device.jpg. Lassen Sie uns es mit LaTeX in eine PDF-Datei einfügen:

$ cat img.tex 
\documentclass{article}
\usepackage{graphicx}
\begin{document}
\includegraphics[width=5in,keepaspectratio]{device}
\end{document}
$ pdflatex img
[...snip...]
Output written on img.pdf (1 page, 672455 bytes).
Transcript written on img.log.

Extrahieren wir es nun pdfimages -allund vergleichen es mit dem Original:

$ pdfimages -all img.pdf img-all
$ cmp device.jpg img-all-000.jpg 
$

Das extrahierte JPG istByte für Byte identischzum Original.

Fußnote: Der Grund für die Verwendung von LaTeX

Der obige Test kann nicht mit jedem beliebigen PDF-Ersteller durchgeführt werden. Dies liegt daran, dass nicht alle PDF-Ersteller Bilder unbeschadet in ein PDF einfügen. Versuchen wir es beispielsweise mit ImageMagick convert:

$ convert device.jpg device.pdf
$ pdfimages -all device.pdf device-all
$ cmp device.jpg device-all-000.jpg 
device.jpg device-all-000.jpg differ: byte 4, line 1

convertDas Bild wurde vor dem Einfügen in das PDF auf eine kleinere Größe neu abgetastet.

$ ls -1s device.jpg device-all-000.jpg 
528 device-all-000.jpg
656 device.jpg

Bildgenauigkeit war eines der Designziele von pdflatex. Andere PDF-Erstellungsprogramme „optimieren“ Bilder möglicherweise standardmäßig, bevor sie in das PDF eingefügt werden.

Aktualisieren: ShreevatsaRweist darauf hin, dass dieimg2pdfDas Dienstprogramm bietet auch eine verlustfreie Methode zum Konvertieren von Bildern in PDF. Auch Nicht-TeX-Benutzer werden die Verwendung wahrscheinlich viel einfacher finden.

Answer 1

pdfimages -allgibt dengenauDatei, die im PDF gespeichert war.

Wir können dies testen, indem wir einen Roundtrip durchführen: Wir beginnen mit einem JPG-Bild, fügen es mit LaTeX zu einem PDF hinzu, extrahieren es mit pdfimages -allund vergleichen es dann mit dem Original. (Der Grund für die Verwendung von LaTeX wird später erklärt.)

Ich habe das erste JPG-Bild, das ich aus Ihrem Link extrahiert habe, und habe es benannt device.jpg. Lassen Sie uns es mit LaTeX in eine PDF-Datei einfügen:

$ cat img.tex 
\documentclass{article}
\usepackage{graphicx}
\begin{document}
\includegraphics[width=5in,keepaspectratio]{device}
\end{document}
$ pdflatex img
[...snip...]
Output written on img.pdf (1 page, 672455 bytes).
Transcript written on img.log.

Extrahieren wir es nun pdfimages -allund vergleichen es mit dem Original:

$ pdfimages -all img.pdf img-all
$ cmp device.jpg img-all-000.jpg 
$

Das extrahierte JPG istByte für Byte identischzum Original.

Fußnote: Der Grund für die Verwendung von LaTeX

Der obige Test kann nicht mit jedem beliebigen PDF-Ersteller durchgeführt werden. Dies liegt daran, dass nicht alle PDF-Ersteller Bilder unbeschadet in ein PDF einfügen. Versuchen wir es beispielsweise mit ImageMagick convert:

$ convert device.jpg device.pdf
$ pdfimages -all device.pdf device-all
$ cmp device.jpg device-all-000.jpg 
device.jpg device-all-000.jpg differ: byte 4, line 1

convertDas Bild wurde vor dem Einfügen in das PDF auf eine kleinere Größe neu abgetastet.

$ ls -1s device.jpg device-all-000.jpg 
528 device-all-000.jpg
656 device.jpg

Bildgenauigkeit war eines der Designziele von pdflatex. Andere PDF-Erstellungsprogramme „optimieren“ Bilder möglicherweise standardmäßig, bevor sie in das PDF eingefügt werden.

Aktualisieren: ShreevatsaRweist darauf hin, dass dieimg2pdfDas Dienstprogramm bietet auch eine verlustfreie Methode zum Konvertieren von Bildern in PDF. Auch Nicht-TeX-Benutzer werden die Verwendung wahrscheinlich viel einfacher finden.

Warum sind die von pdfimages erstellten Bilder bei Verwendung des Flags -all anders?

Antwort1

Fußnote: Der Grund für die Verwendung von LaTeX

verwandte Informationen