¿Por qué el software de dictado de audio como Dragon funciona sólo desde el lado del hablante?

¿Por qué el software de dictado de audio como Dragon funciona sólo desde el lado del hablante?

No quiero que mi computadora portátil o mi teléfono móvil simplemente dicte o escriba lo que digo, sino que escriba lo que dice la persona que llama al otro lado de la línea. ¿Por qué Google o Nuance no habilitan esa funcionalidad? ¿Es siquiera posible? ¿Qué se necesitaría para que eso funcione?

Respuesta1

Cuando habla, su voz se graba a través del micrófono y el hardware de audio de su computadora. Esta señal de audio está disponible para cualquier aplicación en su computadora. Cuando hablas con alguien a través de Skype, la señal de voz se codifica en un montón de paquetes. Necesitaría aplicar ingeniería inversa al protocolo de Skype para decodificar la señal de voz.

Si está hablando por un teléfono celular en modo altavoz, es posible que la calidad no sea lo suficientemente buena para el reconocimiento de voz. Además, el software de reconocimiento de voz debería estar entrenado tanto en su voz como en la de la otra persona.

No estoy seguro de qué relevancia tiene Google aquí.

Respuesta2

Dragon NaturallySpeaking (a diferencia de Google) necesita capacitación antes de poder transcribir el habla en palabras.

Google realiza transcripciones de voz a texto para la persona que llama al otro lado de la línea cuando alguien deja un mensaje en su respuesta automática en Google Voice.

Tenga en cuenta que la calidad de la voz suele verse muy alterada durante una llamada, lo que dificulta aún más el reconocimiento de voz.

información relacionada