trato de hacerDesempaquetarpara funcionar, es una herramienta muy poderosa para posprocesar páginas de libros escaneadas. Leí el documento pero todavía no puedo hacerlo funcionar ni en Windows ni en Linux. Mi imagen es un mapa de bits que convertí al formato .pbm con Gimp (también probé pgm y pnm). Entonces uso este comando:
unpaper -l double --pre-rotate -90 inputFile.pbm outputFile.pbm
(-l doble significa que tengo 2 páginas en una hoja y --pre-rotate -90 gira la imagen hacia la izquierda)
Debería hacer algo como esto:
Pero mi archivo de salida no tiene diferencias entre la entrada, simplemente se gira.
Respuesta1
Finalmente descubrí el problema. El problema fue la conversión al formato .pbm realizada por Gimp (v2.6.11). El archivo convertido no era binario (solo píxeles blancos o negros), mientras que Wikipedia dice "PBM es para mapas de bits (blanco y negro, sin grises)". Entonces uséImagenMagiapara la conversión y ahora desempaquetar funciona perfectamente bien y tengo excelentes resultados con tesseract 3.