輸出機率資料的OCR

2024-4-11 • tag-icon

我想透過使用 OCR 掃描我擁有的印刷書籍，然後透過 TTS 引擎運行文本，將其轉換為音訊。這些書籍不提供電子書。

由於OCR 可能會犯一些小錯誤，尤其是在轉換包含舊字體的圖像時，我希望找到一個OCR 引擎，可以使用描述引擎感知的正確匹配可能性或一系列其他可能性的元資料來標記文字的每個區域。例如，請參閱 Google Voice 的語音郵件轉錄，它以灰色陰影突出顯示每個單詞，指示語音到文字引擎的機率排名。

您知道有哪些套餐提供此服務嗎？

相關內容