Módulos de reconocimiento de voz de Python

Módulos de reconocimiento de voz de Python

Estoy intentando crear una aplicación de transcripción de voz a texto y de texto a voz. Probé módulos de Google e IBM. ¿Puede sugerirme otros módulos que estén disponibles sin conexión?

Respuesta1

Los siguientes son los módulos o bibliotecas de reconocimiento de voz compatibles con Python y también mencioné las bibliotecas que están disponibles sin conexión. por favor pasa por estodocumentopara más información

  • CMU Sphinx (funciona sin conexión)
  • Reconocimiento de voz de Google
  • API de voz de Google Cloud
  • ingenio.ai
  • Discurso de Microsoft Azure
  • Reconocimiento de voz de Microsoft Bing (obsoleto)
  • API de Houndify
  • IBM voz a texto
  • Detección de palabras clave de Snowboy (funciona sin conexión)
  • flujo tensor
  • API Vosk (funciona sin conexión)
  • Susurro de OpenAI (funciona sin conexión)

Respuesta2

complemento descarado :)

Picovoice también procesa datos de voz en el dispositivo y la capa gratuita ofrece 6000 minutos (100 horas) por mes. https://picovoice.ai/

aquí hay un tutorial STT con 3 líneas de Python: https://picovoice.ai/blog/transcribe-speech-to-text-with-tres-lines-of-python/

-trabajando para picovoice

información relacionada