Я хотел бы встроить отсканированный документ в PDF-документ.
Исходное изображение весит около 300 кБ.
Если я используюконвертироватьразмер PDF-файла составляет 30 МБ, а с помощью GIMP — 3 МБ.
Вот итоговые размеры файлов различных команд. Единственный способ, который я нашел, чтобы получить разумный размер файла PDF, это сначала преобразовать в JPEG, а затем в PDF.
scanimage -p --mode Color --format tiff -x 205 -y 297 > image.tiff | 25.5
convert -quality 30 -compress Zip image.tiff image-zip.pdf | 32.2
convert -quality 30 image.tiff image.pdf | 12.1
convert -compress Zip image.tiff image-wq-zip.pdf | 11.1
convert image.tiff image.jpg | 2.3
convert -quality 30 image.tiff image.jpg | 0.34
convert -quality 30 -define jpeg:extent=200kb image.tiff image-200.jpg | 0.19
convert image-200.jpg image-jpg.pdf | 0.19
решение1
Если у вас есть изображение в формате JPEG, вы можете пойти следующим коротким путем. Используйте оболочку jpeg2ps для конвертации в PostScript. Затем используйте ps2pdf для конвертации в PDF.
решение2
Основная причина, по моему мнению, заключается в том, что PDF хранит настройки совместимости, которые могут увеличить размер файла. Если вы используете Adobe Acrobat, вы можете уменьшить размер файла PDF и удалить эти настройки.
Или вы можете встроить свое изображение в Word. Просто вставьте изображение и сохраните файл как PDF, но выберите «Минимальный размер (публикация онлайн)», когда выберете PDF из меню «Сохранить как тип».
Настройки совместимости — это то, что делает PDF-файл пригодным для просмотра и печати с приемлемым качеством, и, возможно, именно они являются причиной широкого распространения PDF-файлов.
решение3
PDF-файлы всегда имеют неявный размер бумаги, например 8,5x11 дюймов, и обычно экспортируются с разрешением 250–300 пикселей на дюйм.
Лист бумаги размером 8,5x11 будет иметь разрешение около 2550x3300 пикселей.
Цветовое изображение RGB для экрана представляет собой 3 «канала» (изображения в оттенках серого), а CMYK — 4. Оттенки серого — это один канал.
Для «обычных изображений» пиксель — это 1 байт на канал.
Таким образом, 2550x3300x3/1024/1024 = около 24 МБ для RGB (32 МБ для CMYK) (без сжатия).
Звучит примерно так. Сжатие JPEG дает гораздо больше, но за счет качества, поскольку оно уничтожает данные в процессе сжатия.
Обратите внимание, чтоРазмещение изображения документа в контейнере PDF в точке с координатами 0,0 и размером страницы = размеру изображения ничего вам не даст. Это как заворачивать подарок в другой подарок.
Если вы сканируете черно-белые документы, вы можете изначально уменьшить размер на 1/3, не используя режим RGB.
Однако следует учитывать, что изображения JPEG без RGB-цветов поддерживаются не везде.