Почему PDF-файл, содержащий только одно изображение, намного больше самого изображения?

Почему PDF-файл, содержащий только одно изображение, намного больше самого изображения?

Я хотел бы встроить отсканированный документ в PDF-документ.

Исходное изображение весит около 300 кБ.
Если я используюконвертироватьразмер PDF-файла составляет 30 МБ, а с помощью GIMP — 3 МБ.

Вот итоговые размеры файлов различных команд. Единственный способ, который я нашел, чтобы получить разумный размер файла PDF, это сначала преобразовать в JPEG, а затем в PDF.

scanimage -p --mode Color --format tiff -x 205 -y 297 > image.tiff      | 25.5
convert -quality 30  -compress Zip image.tiff image-zip.pdf             | 32.2
convert -quality 30   image.tiff image.pdf                              | 12.1
convert -compress Zip image.tiff image-wq-zip.pdf                       | 11.1

convert image.tiff image.jpg                                            | 2.3
convert -quality 30 image.tiff image.jpg                                | 0.34
convert -quality 30 -define jpeg:extent=200kb image.tiff image-200.jpg  | 0.19

convert image-200.jpg image-jpg.pdf                                     | 0.19

решение1

Если у вас есть изображение в формате JPEG, вы можете пойти следующим коротким путем. Используйте оболочку jpeg2ps для конвертации в PostScript. Затем используйте ps2pdf для конвертации в PDF.

решение2

Основная причина, по моему мнению, заключается в том, что PDF хранит настройки совместимости, которые могут увеличить размер файла. Если вы используете Adobe Acrobat, вы можете уменьшить размер файла PDF и удалить эти настройки.

Или вы можете встроить свое изображение в Word. Просто вставьте изображение и сохраните файл как PDF, но выберите «Минимальный размер (публикация онлайн)», когда выберете PDF из меню «Сохранить как тип».

Настройки совместимости — это то, что делает PDF-файл пригодным для просмотра и печати с приемлемым качеством, и, возможно, именно они являются причиной широкого распространения PDF-файлов.

решение3

PDF-файлы всегда имеют неявный размер бумаги, например 8,5x11 дюймов, и обычно экспортируются с разрешением 250–300 пикселей на дюйм.

Лист бумаги размером 8,5x11 будет иметь разрешение около 2550x3300 пикселей.

Цветовое изображение RGB для экрана представляет собой 3 «канала» (изображения в оттенках серого), а CMYK — 4. Оттенки серого — это один канал.

Для «обычных изображений» пиксель — это 1 байт на канал.

Таким образом, 2550x3300x3/1024/1024 = около 24 МБ для RGB (32 МБ для CMYK) (без сжатия).

Звучит примерно так. Сжатие JPEG дает гораздо больше, но за счет качества, поскольку оно уничтожает данные в процессе сжатия.

Обратите внимание, чтоРазмещение изображения документа в контейнере PDF в точке с координатами 0,0 и размером страницы = размеру изображения ничего вам не даст. Это как заворачивать подарок в другой подарок.

Если вы сканируете черно-белые документы, вы можете изначально уменьшить размер на 1/3, не используя режим RGB.

Однако следует учитывать, что изображения JPEG без RGB-цветов поддерживаются не везде.

введите описание изображения здесь

Связанный контент