![확률 데이터를 출력하는 OCR](https://rvso.com/image/50587/%ED%99%95%EB%A5%A0%20%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%A5%BC%20%EC%B6%9C%EB%A0%A5%ED%95%98%EB%8A%94%20OCR.png)
내가 소유한 인쇄된 책을 OCR로 스캔한 다음 TTS 엔진을 통해 텍스트를 실행하여 오디오로 변환하고 싶습니다. 이 책은 eBook으로 제공되지 않습니다.
OCR은 특히 오래된 서체가 포함된 이미지를 변환할 때 작은 오류를 범할 수 있으므로 엔진이 인식한 올바른 일치 가능성이나 기타 가능성을 설명하는 메타데이터로 각 텍스트 영역에 태그를 지정할 수 있는 OCR 엔진을 찾고 싶습니다. 예를 들어 음성-텍스트 엔진의 확률 순위를 나타내는 회색 음영으로 각 단어를 강조 표시하는 Google Voice의 음성 메일 텍스트 변환을 참조하세요.
이것을 제공하는 패키지를 알고 있습니까?