확률 데이터를 출력하는 OCR

2024-4-11 • tag-icon

내가 소유한 인쇄된 책을 OCR로 스캔한 다음 TTS 엔진을 통해 텍스트를 실행하여 오디오로 변환하고 싶습니다. 이 책은 eBook으로 제공되지 않습니다.

OCR은 특히 오래된 서체가 포함된 이미지를 변환할 때 작은 오류를 범할 수 있으므로 엔진이 인식한 올바른 일치 가능성이나 기타 가능성을 설명하는 메타데이터로 각 텍스트 영역에 태그를 지정할 수 있는 OCR 엔진을 찾고 싶습니다. 예를 들어 음성-텍스트 엔진의 확률 순위를 나타내는 회색 음영으로 각 단어를 강조 표시하는 Google Voice의 음성 메일 텍스트 변환을 참조하세요.

이것을 제공하는 패키지를 알고 있습니까?

관련 정보