![画像後処理 : Unpaper](https://rvso.com/image/1284412/%E7%94%BB%E5%83%8F%E5%BE%8C%E5%87%A6%E7%90%86%20%3A%20Unpaper.png)
私は作ろうとする紙切れ動作させるには、スキャンした本のページを後処理するための非常に強力なツールが必要です。ドキュメントを読みましたが、Windows でも Linux でも動作させることができません。私の画像は、Gimp で .pbm 形式に変換したビットマップです (pgm と pnm も試しました)。次に、次のコマンドを使用します。
unpaper -l double --pre-rotate -90 inputFile.pbm outputFile.pbm
(-l double は 1 枚のシートに 2 ページあることを意味し、--pre-rotate -90 は画像を左に回転させます)
次のような動作になるはずです:
しかし、出力ファイルには入力との違いはなく、回転しているだけです。
答え1
ようやく問題が分かりました。問題は、Gimp (v2.6.11) による .pbm 形式への変換でした。変換されたファイルはバイナリ (白または黒のピクセルのみ) ではありませんでしたが、Wikipedia には「PBM はビットマップ用です (白黒、グレーなし)「だから私はイメージマジック変換後、unpaper は完璧に動作し、tesseract 3 で優れた結果が得られました。