![OCR que genera datos de probabilidad](https://rvso.com/image/50587/OCR%20que%20genera%20datos%20de%20probabilidad.png)
Me gustaría convertir libros impresos que tengo en audio escaneándolos con OCR y luego ejecutando el texto a través de un motor TTS. Estos títulos no están disponibles como libros electrónicos.
Dado que el OCR puede cometer pequeños errores, especialmente al convertir imágenes que contienen tipos de letra antiguos, me gustaría encontrar un motor de OCR que pueda etiquetar cada región de texto con metadatos que describan la probabilidad percibida por el motor de una coincidencia correcta, o una serie de otras posibilidades. Por ejemplo, vea la transcripción del correo de voz de Google Voice, que resalta cada palabra en tonos de gris, lo que indica la clasificación de probabilidad del motor de conversión de voz a texto.
¿Conoce algún paquete que ofrezca esto?