画像を 1 つだけ含む PDF のサイズが、画像自体よりもずっと大きいのはなぜですか?

画像を 1 つだけ含む PDF のサイズが、画像自体よりもずっと大きいのはなぜですか?

スキャンした文書を PDF 文書に埋め込みたいです。

ソース画像は約300kBです
変換するコマンドを使用すると、PDF のサイズは 30 MB になりますが、GIMP を使用すると 3 MB になります。

さまざまなコマンドの結果のファイル サイズは次のとおりです。適切な PDF ファイル サイズを取得する唯一の方法は、最初に JPEG に変換し、次に PDF に変換することです。

scanimage -p --mode Color --format tiff -x 205 -y 297 > image.tiff      | 25.5
convert -quality 30  -compress Zip image.tiff image-zip.pdf             | 32.2
convert -quality 30   image.tiff image.pdf                              | 12.1
convert -compress Zip image.tiff image-wq-zip.pdf                       | 11.1

convert image.tiff image.jpg                                            | 2.3
convert -quality 30 image.tiff image.jpg                                | 0.34
convert -quality 30 -define jpeg:extent=200kb image.tiff image-200.jpg  | 0.19

convert image-200.jpg image-jpg.pdf                                     | 0.19

答え1

JPEG 形式の画像がある場合は、次の簡単な方法で変換できます。jpeg2ps ラッパーを使用して PostScript に変換します。次に、ps2pdf を使用して PDF に変換します。

答え2

私の考えでは、主な理由は PDF に互換性設定が保存されており、ファイル サイズが大きくなる可能性があることです。Adobe Acrobat を使用する場合は、PDF ファイル サイズを縮小してこれらの設定を削除することができます。

または、Word に画像を埋め込むこともできます。画像を挿入してファイルを PDF として保存しますが、「ファイルの種類」メニューから PDF を選択するときに「最小サイズ (オンライン公開)」を選択します。

互換性設定により、PDF を適切な品質で表示および印刷できるようになり、おそらくこれが PDF が広く普及している理由です。

答え3

PDF には常に 8.5x11 インチなどの暗黙の用紙サイズがあり、通常は 250 ~ 300ppi でエクスポートされます。

8.5x11 の紙は約 2550x3300 ピクセルになります。

画面用の RGB カラー画像は 3 つの「チャネル」(グレースケール画像)で、CMYK は 4 つです。グレースケールは単一チャネルです。

「通常の画像」の場合、ピクセルはチャネルごとに 1 バイトです。

つまり、2550x3300x3/1024/1024 = RGB の場合は約 24MB (CMYK の場合は 32MB) (非圧縮)。

確かにその通りですね。Jpeg 圧縮では圧縮プロセス中にデータが破壊されるため、品質が犠牲になりますが、はるかに多くのメリットが得られます。

ご了承くださいページ サイズ = 画像サイズで、PDF コンテナーの 0,0 原点にドキュメントの画像を配置しても何も起こりません。プレゼントを別のプレゼントで包むようなものです。

白黒文書をスキャンする場合は、RGB モードを使用しないことで、最初はサイズを 1/3 に削減できます。

ただし、RGB 以外の Jpeg 画像は普遍的にサポートされているわけではないことに注意してください。

ここに画像の説明を入力してください

関連情報