Gostaria de incorporar um documento digitalizado em um documento PDF.
A imagem de origem tem cerca de 300 kB.
Se eu usar oconvertercomando, o PDF tem tamanho de 30 MB, e com o GIMP, 3 MB.
Aqui estão os tamanhos de arquivo resultantes de vários comandos. A única maneira que encontrei de obter um tamanho de arquivo PDF razoável é primeiro converter para JPEG e depois para PDF.
scanimage -p --mode Color --format tiff -x 205 -y 297 > image.tiff | 25.5
convert -quality 30 -compress Zip image.tiff image-zip.pdf | 32.2
convert -quality 30 image.tiff image.pdf | 12.1
convert -compress Zip image.tiff image-wq-zip.pdf | 11.1
convert image.tiff image.jpg | 2.3
convert -quality 30 image.tiff image.jpg | 0.34
convert -quality 30 -define jpeg:extent=200kb image.tiff image-200.jpg | 0.19
convert image-200.jpg image-jpg.pdf | 0.19
Responder1
Se você tiver uma imagem no formato JPEG, poderá seguir o seguinte caminho. Use o wrapper jpeg2ps para converter para PostScript. Em seguida, use ps2pdf para converter em PDF.
Responder2
A principal razão, na minha opinião, é que o PDF armazena configurações de compatibilidade que podem aumentar o tamanho do arquivo. Se você usa o Adobe Acrobat, pode reduzir o tamanho do arquivo PDF e remover essas configurações.
Ou você pode incorporar sua imagem no Word. Basta inserir a imagem e salvar o arquivo como PDF, mas escolha ‘Tamanho mínimo (publicação online)’ ao selecionar PDF no menu ‘Salvar como tipo’.
As configurações de compatibilidade são o que tornam o PDF visível e imprimível com uma qualidade razoável e talvez sejam a razão da disseminação do PDF.
Responder3
Os PDFs sempre têm um tamanho de papel implícito, como 8,5 x 11 polegadas e normalmente são exportados entre 250 e 300 ppi.
Uma folha de papel 8,5x11 terá cerca de 2550x3300 pixels.
Uma imagem colorida RGB para tela tem 3 "canais" (imagens em escala de cinza) e CMYK tem 4. A escala de cinza é um canal único.
Para "imagens normais", um pixel equivale a 1 byte por canal.
Portanto, 2550x3300x3/1024/1024 = cerca de 24 MB para RGB (32 MB para CMYK) (descompactado).
Parece correto. A compactação JPEG leva você muito mais longe, mas às custas da qualidade, pois destrói os dados durante o processo de compactação.
Observe quecolocar uma imagem de um documento em um contêiner PDF na origem 0,0 com tamanho de página = tamanho da imagem não faz nada para você. É como embrulhar um presente em outro presente.
Se estiver digitalizando documentos em preto e branco, você poderá reduzir o tamanho em 1/3 inicialmente, não usando o modo RGB.
Esteja ciente de que imagens JPEG não RGB não são universalmente suportadas.