Estoy intentando crear una aplicación de transcripción de voz a texto y de texto a voz. Probé módulos de Google e IBM. ¿Puede sugerirme otros módulos que estén disponibles sin conexión?
Respuesta1
Los siguientes son los módulos o bibliotecas de reconocimiento de voz compatibles con Python y también mencioné las bibliotecas que están disponibles sin conexión. por favor pasa por estodocumentopara más información
- CMU Sphinx (funciona sin conexión)
- Reconocimiento de voz de Google
- API de voz de Google Cloud
- ingenio.ai
- Discurso de Microsoft Azure
- Reconocimiento de voz de Microsoft Bing (obsoleto)
- API de Houndify
- IBM voz a texto
- Detección de palabras clave de Snowboy (funciona sin conexión)
- flujo tensor
- API Vosk (funciona sin conexión)
- Susurro de OpenAI (funciona sin conexión)
Respuesta2
complemento descarado :)
Picovoice también procesa datos de voz en el dispositivo y la capa gratuita ofrece 6000 minutos (100 horas) por mes. https://picovoice.ai/
aquí hay un tutorial STT con 3 líneas de Python: https://picovoice.ai/blog/transcribe-speech-to-text-with-tres-lines-of-python/
-trabajando para picovoice