Я пытаюсь создать приложение для преобразования речи в текст и текста в речь. Я пробовал модули от Google и IBM, можете ли вы порекомендовать другие модули, доступные офлайн?
решение1
Ниже приведены модули распознавания речи или библиотеки, поддерживаемые Python, и я также упомянул библиотеки, которые доступны офлайн. Пожалуйста, ознакомьтесь с этимдокументЧтобы получить больше информации
- CMU Sphinx (работает офлайн)
- Распознавание речи Google
- API Google Cloud Speech
- Wit.ai
- Microsoft Azure Речь
- Распознавание голоса Microsoft Bing (устарело)
- API Houndify
- IBM Речь в Текст
- Snowboy Hotword Detection (работает офлайн)
- Тензорфлоу
- Vosk API (работает офлайн)
- OpenAI шепот (работает офлайн)
решение2
бесстыдный плагин :)
Picovoice также обрабатывает речевые данные на устройстве, а бесплатный уровень предлагает 6000 минут (100 часов) в месяц. https://picovoice.ai/
Вот руководство по STT с тремя строками кода на Python: https://picovoice.ai/blog/transcribe-speech-to-text-with-three-lines-of-python/
-работаю на picovoice