我有一份 pdf 目錄,是客戶以 pdf 格式提供給我的。他們沒有圖片,但有 pdf 格式。
有沒有辦法使用命令列工具從 pdf 中提取所有圖像,同時保留其原始檔案名稱?
我在這裡回顧了這個問題:使用圖層蒙版從 PDF 中提取圖像 但它適用於單一圖像。
答案1
pdfimages
軟體包中的程式poppler-utils
可能就是您正在尋找的程式。從手冊頁:
Pdfimages 讀取 PDF 文件 PDF 文件,掃描一頁或多頁,並為每個影像寫入一個 PPM、PBM 或 JPEG 檔案。
在較新的版本上poppler-utils 有一個all
擷取 jpg 或 png 的開關:
pdfimages -all input.pdf images/prefix
將以以下形式輸出文件前綴-nnn。在裡面圖片資料夾。