我有一個重要的pdf,我需要盡可能無損地提取來源影像(例如使用png)出於某種原因,來源影像似乎是由226個影像條紋組成的,當我提取這些影像時,例如使用
pdfimages -png name.pdf out-
我得到了 227 條小條紋。那不是我想要的。有沒有辦法獲得一張圖像?使用pdfimages-列表告訴我有關條紋的信息,並使用例如上面的內容pdfimages -png 名稱.pdf 輸出-給我 227 張單張圖像。例如,一張影像的寬度為 1604 像素,高度為 5 像素。據我檢查,所有圖像的高度似乎都是 5 px,並且有 227 個單圖像,我應該得到一張 1604 x 1135 px 的單圖像。
更新 我忘了補充一點,Ryan J. Yoder 下面寫的也是我自己對這個問題的想法,這意味著 pdf 確實是透過將原始圖像分割成 227 個條紋來創建的。
總之,如果是這樣的話(pdfimages-列表說是這樣)有沒有一種方法可以自動從條紋中創建一個圖像,例如使用graphicsmagick。
答案1
Ghostscript 可用於取得檢視器中出現的頁面影像,例如,名為, , ….png
的 300 dpi 影像,來自:out_001.png
out_002.png
in.pdf
gs -q -dBATCH -dNOPAUSE -sDEVICE=png16m -r300 -sOutputFile=out_%03d.png in.pdf
答案2
您可以使用 ImageMagick 使用命令列將 PDF「轉換」為 png:
convert -density 300 page.pdf page.png
或您想要的任何密度 (DPI)。