我正在嘗試建立一個語音到文字和文字到語音轉錄應用程式。我嘗試了 Google 和 IBM 的模組,您能否建議任何其他可離線使用的模組。
答案1
以下是Python支援的語音辨識模組或函式庫,我還提到了可以離線使用的函式庫。請完成這個文件了解更多信息
- CMU Sphinx(離線工作)
- 谷歌語音識別
- 谷歌雲端語音API
- 維特人工智慧
- 微軟Azure語音
- Microsoft Bing 語音辨識(已棄用)
- Houndify API
- IBM 語音轉文本
- Snowboy 熱詞偵測(離線工作)
- 張量流
- Vosk API(離線工作)
- OpenAI 耳語(離線工作)
答案2
無恥的插件:)
Picovoice 還在設備上處理語音數據,免費套餐每月提供 6000 分鐘(100 小時)。 https://picovoice.ai/
這是一個包含 3 行 Python 程式碼的 STT 教學: https://picovoice.ai/blog/transcribe-speech-to-text-with- Three-lines-of-python/
-為 picovoice 工作