Por que um PDF contendo apenas uma imagem é muito maior que a própria imagem?

Por que um PDF contendo apenas uma imagem é muito maior que a própria imagem?

Gostaria de incorporar um documento digitalizado em um documento PDF.

A imagem de origem tem cerca de 300 kB.
Se eu usar oconvertercomando, o PDF tem tamanho de 30 MB, e com o GIMP, 3 MB.

Aqui estão os tamanhos de arquivo resultantes de vários comandos. A única maneira que encontrei de obter um tamanho de arquivo PDF razoável é primeiro converter para JPEG e depois para PDF.

scanimage -p --mode Color --format tiff -x 205 -y 297 > image.tiff      | 25.5
convert -quality 30  -compress Zip image.tiff image-zip.pdf             | 32.2
convert -quality 30   image.tiff image.pdf                              | 12.1
convert -compress Zip image.tiff image-wq-zip.pdf                       | 11.1

convert image.tiff image.jpg                                            | 2.3
convert -quality 30 image.tiff image.jpg                                | 0.34
convert -quality 30 -define jpeg:extent=200kb image.tiff image-200.jpg  | 0.19

convert image-200.jpg image-jpg.pdf                                     | 0.19

Responder1

Se você tiver uma imagem no formato JPEG, poderá seguir o seguinte caminho. Use o wrapper jpeg2ps para converter para PostScript. Em seguida, use ps2pdf para converter em PDF.

Responder2

A principal razão, na minha opinião, é que o PDF armazena configurações de compatibilidade que podem aumentar o tamanho do arquivo. Se você usa o Adobe Acrobat, pode reduzir o tamanho do arquivo PDF e remover essas configurações.

Ou você pode incorporar sua imagem no Word. Basta inserir a imagem e salvar o arquivo como PDF, mas escolha ‘Tamanho mínimo (publicação online)’ ao selecionar PDF no menu ‘Salvar como tipo’.

As configurações de compatibilidade são o que tornam o PDF visível e imprimível com uma qualidade razoável e talvez sejam a razão da disseminação do PDF.

Responder3

Os PDFs sempre têm um tamanho de papel implícito, como 8,5 x 11 polegadas e normalmente são exportados entre 250 e 300 ppi.

Uma folha de papel 8,5x11 terá cerca de 2550x3300 pixels.

Uma imagem colorida RGB para tela tem 3 "canais" (imagens em escala de cinza) e CMYK tem 4. A escala de cinza é um canal único.

Para "imagens normais", um pixel equivale a 1 byte por canal.

Portanto, 2550x3300x3/1024/1024 = cerca de 24 MB para RGB (32 MB para CMYK) (descompactado).

Parece correto. A compactação JPEG leva você muito mais longe, mas às custas da qualidade, pois destrói os dados durante o processo de compactação.

Observe quecolocar uma imagem de um documento em um contêiner PDF na origem 0,0 com tamanho de página = tamanho da imagem não faz nada para você. É como embrulhar um presente em outro presente.

Se estiver digitalizando documentos em preto e branco, você poderá reduzir o tamanho em 1/3 inicialmente, não usando o modo RGB.

Esteja ciente de que imagens JPEG não RGB não são universalmente suportadas.

insira a descrição da imagem aqui

informação relacionada