画像後処理 : Unpaper

画像後処理 : Unpaper

私は作ろうとする紙切れ動作させるには、スキャンした本のページを後処理するための非常に強力なツールが必要です。ドキュメントを読みましたが、Windows でも Linux でも動作させることができません。私の画像は、Gimp で .pbm 形式に変換したビットマップです (pgm と pnm も試しました)。次に、次のコマンドを使用します。

unpaper -l double --pre-rotate -90 inputFile.pbm outputFile.pbm

(-l double は 1 枚のシートに 2 ページあることを意味し、--pre-rotate -90 は画像を左に回転させます)

次のような動作になるはずです:

ここに画像の説明を入力してください

しかし、出力ファイルには入力との違いはなく、回転しているだけです。

答え1

ようやく問題が分かりました。問題は、Gimp (v2.6.11) による .pbm 形式への変換でした。変換されたファイルはバイナリ (白または黒のピクセルのみ) ではありませんでしたが、Wikipedia には「PBM はビットマップ用です (白黒、グレーなし)「だから私はイメージマジック変換後、unpaper は完璧に動作し、tesseract 3 で優れた結果が得られました。

関連情報