如何*自動*對掃描頁面製作的 PDF 進行糾偏和裁剪?

如何*自動*對掃描頁面製作的 PDF 進行糾偏和裁剪?

可能的重複:
我可以使用哪些免費軟體來消除掃描影像的歪斜

我有幾個由書頁掃描件組成的 PDF。掃描一次包含兩頁,其中一些掃描是傾斜的,使文字看起來稍微傾斜。

我正在尋找一種工具,可以讓我透過校正掃描來進行自動最佳化,而不會失去可讀性。我找到了 GPL 軟體布里斯裁剪掃描件以獲得 1:1 的頁面比例而不是 2:1,但我沒有任何工具來校正頁面。

我偶然發現拆紙,另一個開源工具似乎非常適合我想做的事情,但該工具僅適用於 Linux,並且不能直接處理 PDF 文件。

任何提示表示讚賞。

答案1

看一下時滯校正。它是一個命令列工具。下載的 *zip 似乎包含適用於 Windows、MacOSX 和 Linux 的二進位。

授權是 MPL (Mozilla) 或 LPGL (GNU),無論您喜歡什麼。

對您來說唯一的缺點似乎是它不消耗 PDF,僅消耗 PNG 和 TIFF 圖像(AFAICS)。這意味著您必須建立一個工作流程。喜歡:

 PDF.orig -> PNG.orig -> PNG.deskewed -> PDF.deskewed

我自己還沒有測試過它,我最近才發現這個網站並將其添加為書籤。

答案2

哦,讓我再增加一個答案。我剛想起來網路PBM。好幾年沒用了,但我想我應該重新看看...

netpbm 是一個非常強大的工具包,用於命令列操作圖形圖像。它提供了近 300 個獨立的工具。它包括大約 100 種圖形格式的轉換器。

它還有一個可以旋轉圖像的命令列工具:

pnmrotate

它還有另一個工具試圖發現旋轉圖像的角度:

pamtilt

pamtilt傳回影像旋轉猜測的浮點數。所以影像的自動去歪斜應該是觸手可及的。可以編寫 shell 腳本來執行此操作。這需要不同的步驟:

  1. 借助 Ghostscript 將 PDF 頁面轉換為適合 netpbm 的圖像格式。
  2. 用於pamtilt自動發現影像的傾斜角度。
  3. 用於pnmrotate消除影像的傾斜。
  4. 將圖像重新轉換為 PDF。

如果您允許我存取您的 PDF 文件的一小部分樣本,我可以嘗試編寫 shell 腳本來完成這項任務。


(我很想知道[netpbm]在超級用戶+stackoverflow上沒有標籤。)

相關內容