私は作ろうとする紙切れ動作させるには、スキャンした本のページを後処理するための非常に強力なツールが必要です。ドキュメントを読みましたが、Windows でも Linux でも動作させることができません。私の画像は、Gimp で .pbm 形式に変換したビットマップです (pgm と pnm も試しました)。次に、次のコマンドを使用します。
unpaper -l double --pre-rotate -90 inputFile.pbm outputFile.pbm
(-l double は 1 枚のシートに 2 ページあることを意味し、--pre-rotate -90 は画像を左に回転させます)
次のような動作になるはずです:
しかし、出力ファイルには入力との違いはなく、回転しているだけです。
答え1
ようやく問題が分かりました。問題は、Gimp (v2.6.11) による .pbm 形式への変換でした。変換されたファイルはバイナリ (白または黒のピクセルのみ) ではありませんでしたが、Wikipedia には「PBM はビットマップ用です (白黒、グレーなし)「だから私はイメージマジック変換後、unpaper は完璧に動作し、tesseract 3 で優れた結果が得られました。