Ich versuche zu machenPapier entfernenum zu funktionieren, es ist ein sehr leistungsfähiges Werkzeug, um gescannte Buchseiten nachzubearbeiten. Ich habe das Dokument gelesen, aber es funktioniert weder unter Windows noch unter Linux. Mein Bild ist ein Bitmap, das ich mit Gimp in das .pbm-Format konvertiert habe (habe auch pgm und pnm ausprobiert). Dann verwende ich diesen Befehl:
unpaper -l double --pre-rotate -90 inputFile.pbm outputFile.pbm
(-l double bedeutet, dass ich 2 Seiten auf einem Blatt habe und --pre-rotate -90 dreht das Bild nach links)
Es sollte ungefähr so aussehen:
Aber meine Ausgabedatei weist keine Unterschiede zur Eingabe auf, sie ist nur rotiert.
Antwort1
Ich habe endlich das Problem herausgefunden. Das Problem war die Konvertierung in das .pbm-Format durch Gimp (v2.6.11). Die konvertierte Datei war nicht binär (nur weiße oder schwarze Pixel), während Wikipedia sagt: „PBM ist für Bitmaps (schwarz und weiß, keine Grautöne)". Also benutzte ichBildMagickfür die Konvertierung und jetzt funktioniert Unpaper perfekt und ich habe hervorragende Ergebnisse mit Tesseract 3.