為什麼僅包含一張圖像的 PDF 比圖像本身大得多?

為什麼僅包含一張圖像的 PDF 比圖像本身大得多?

我想將掃描文件嵌入到 PDF 文件中。

來源圖片約300 kB。
如果我使用轉變指令中,PDF 的大小為 30 MB,使用 GIMP 時,大小為 3 MB。

這裡是各種命令生成的檔案大小。我發現獲得合理 PDF 文件大小的唯一方法是先轉換為 JPEG,然後轉換為 PDF。

scanimage -p --mode Color --format tiff -x 205 -y 297 > image.tiff      | 25.5
convert -quality 30  -compress Zip image.tiff image-zip.pdf             | 32.2
convert -quality 30   image.tiff image.pdf                              | 12.1
convert -compress Zip image.tiff image-wq-zip.pdf                       | 11.1

convert image.tiff image.jpg                                            | 2.3
convert -quality 30 image.tiff image.jpg                                | 0.34
convert -quality 30 -define jpeg:extent=200kb image.tiff image-200.jpg  | 0.19

convert image-200.jpg image-jpg.pdf                                     | 0.19

答案1

如果您有 JPEG 格式的影像,則可以採用以下簡單方法。使用 jpeg2ps 包裝器轉換為 PostScript。然後使用ps2pdf轉換為PDF。

答案2

我認為主要原因是 PDF 儲存的兼容性設定可能會增加文件大小。如果您使用 Adob​​e Acrobat,則可以使用縮小 PDF 檔案大小並刪除這些設定。

或者您可以將圖像嵌入到 Word 中。只需插入圖像並將文件另存為 PDF,但當您從「儲存類型」功能表中選擇 PDF 時,請選擇「最小尺寸(線上發布)」。

相容性設定使 PDF 能夠以合理的品質檢視和列印,也許它們也是 PDF 廣泛傳播的原因。

答案3

PDF 始終具有隱式紙張尺寸,例如 8.5x11 英寸,通常以 250-300ppi 匯出。

一張 8.5x11 的紙大約有 2550x3300 像素。

螢幕的 RGB 彩色影像是 3 個「通道」(灰階影像),CMYK 是 4 個通道。

對於“普通圖像”,一個像素是每個通道 1 個位元組。

因此,2550x3300x3/1024/1024 = RGB 約為 24MB(CMYK 為 32MB)(未壓縮)。

聽起來不錯。 Jpeg 壓縮可以讓您走得更遠,但會犧牲質量,因為它會在壓縮過程中破壞資料。

注意將文件影像放置在 PDF 容器中的 0,0 原點且頁面大小=影像大小對您沒有任何幫助。這就像將一件禮物包裹在另一件禮物中一樣。

如果您掃描黑白文檔,最初可以不使用 RGB 模式將尺寸縮小 1/3。

但請注意,非 RGB Jpeg 影像並未得到普遍支援。

在此輸入影像描述

相關內容