如何將影像檔案轉換並合併為 pdf 檔案？

Question 1

也許是一個遠景，但我使用pdflatex.我會建立一個以下樣式的文件（帶有腳本或其他內容）：

\documentclass{report}
\usepackage{graphicx}
\begin{document}
\includegraphics[width=0.95\textwidth]{img000}\par
\includegraphics[width=0.95\textwidth]{img001}\par

[...]

\includegraphics[width=0.95\textwidth]{img200}\par
\end{document}

然後用運行它pdflatex file。構圖速度很快（而且你可以輕鬆地——如果你了解 LaTeX——改變圖像的形狀和位置，添加標題等...）

問題是該文件通常很大；我用 500K+ 的 200 張 jpg 進行了測試——在我的 i5/16G 內存上運行大約需要 7 秒，並給出了 800Mbyte 的 PDF。我試圖透過使用來減小它的大小

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH -sOutputFile=lowres.pdf file.pdf

……它已經運行了 8 分鐘，但沒有使用大量 RAM。我無法評論壓縮，因為gs它比我聰明，發現我使用同一張圖像 200 次，所以將其壓縮為 50k PDF……這顯然不是真實的。

Answer

也許是一個遠景，但我使用pdflatex.我會建立一個以下樣式的文件（帶有腳本或其他內容）：

\documentclass{report}
\usepackage{graphicx}
\begin{document}
\includegraphics[width=0.95\textwidth]{img000}\par
\includegraphics[width=0.95\textwidth]{img001}\par

[...]

\includegraphics[width=0.95\textwidth]{img200}\par
\end{document}

然後用運行它pdflatex file。構圖速度很快（而且你可以輕鬆地——如果你了解 LaTeX——改變圖像的形狀和位置，添加標題等...）

問題是該文件通常很大；我用 500K+ 的 200 張 jpg 進行了測試——在我的 i5/16G 內存上運行大約需要 7 秒，並給出了 800Mbyte 的 PDF。我試圖透過使用來減小它的大小

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH -sOutputFile=lowres.pdf file.pdf

……它已經運行了 8 分鐘，但沒有使用大量 RAM。我無法評論壓縮，因為gs它比我聰明，發現我使用同一張圖像 200 次，所以將其壓縮為 50k PDF……這顯然不是真實的。

Question 2

很遺憾convert更改之前的圖像，以便將jpg您需要使用的原始圖像的質量損失降到最低img2pdf，我使用以下命令：

較短的單襯管解決方案，也僅使用img2pdf特徵

製作PDF

img2pdf *.jp* --output combined.pdf
OCR 輸出 PDF

ocrmypdf combined.pdf combined_ocr.pdf

這是原始命令，需要更多命令和更多工具：

1) 這是為了將pdf每個jpg影像建立一個文件，而不會損失解析度或品質：

ls -1 ./*jpg | xargs -L1 -I {} img2pdf {} -o {}.pdf

2）這將pdf頁面連接成一個：

pdftk *.pdf cat output combined.pdf

3）最後我添加了一個OCRed文字層，它不會改變pdf中的掃描質量，因此它們可以被搜尋：

pypdfocr combined.pdf

Answer