Estou tentando criar um aplicativo de transcrição de fala para texto e texto para fala. Experimentei módulos do Google e da IBM. Você pode sugerir outros módulos que estejam disponíveis offline.
Responder1
A seguir estão os módulos ou bibliotecas de reconhecimento de fala suportados pelo python e também mencionei as bibliotecas que estão disponíveis offline. por favor passe por issodocumentoPara maiores informações
- Esfinge CMU (funciona offline)
- Reconhecimento de fala do Google
- API de fala do Google Cloud
- Wit.ai
- Fala do Microsoft Azure
- Reconhecimento de voz do Microsoft Bing (obsoleto)
- API Houndify
- IBM Fala para Texto
- Detecção de Hotword do Snowboy (funciona offline)
- Fluxo tensor
- API Vosk (funciona offline)
- Sussurro OpenAI (funciona offline)
Responder2
plug-in sem vergonha :)
O Picovoice também processa dados de fala no dispositivo e o nível gratuito oferece 6.000 minutos (100 horas) por mês. https://picovoice.ai/
aqui está um tutorial STT com 3 linhas de Python: https://picovoice.ai/blog/transcribe-speech-to-text-with-três-linhas-of-python/
-trabalhando para picovoice