Por que softwares de ditado de áudio como o Dragon funcionam apenas do lado do locutor?

Por que softwares de ditado de áudio como o Dragon funcionam apenas do lado do locutor?

Não quero que meu laptop ou celular apenas dite/digite o que eu digo, mas, em vez disso, escreva o que diz o chamador do outro lado da linha. Por que o Google ou a Nuance não habilitam essa funcionalidade? É mesmo possível? O que seria necessário para que isso funcionasse?

Responder1

Quando você fala, sua voz é gravada pelo microfone e pelo hardware de áudio do computador. Este sinal de áudio está disponível para qualquer aplicativo do seu computador. Quando você está falando com alguém pelo Skype, o sinal de voz é codificado em vários pacotes. Você precisaria fazer engenharia reversa do protocolo do Skype para decodificar o sinal de voz.

Se você estiver falando ao celular no modo viva-voz, a qualidade pode não ser boa o suficiente para o reconhecimento de voz. Além disso, o software de reconhecimento de voz precisaria ser treinado tanto na sua voz quanto na da outra pessoa.

Não tenho certeza da relevância que o Google tem aqui.

Responder2

Dragon NaturallySpeaking (ao contrário do Google) precisa ser treinado antes de poder transcrever a fala em palavras.

O Google faz transcrições de voz para texto para o chamador do outro lado da linha quando alguém deixa uma mensagem em sua resposta automática no Google Voice.

Observe que a qualidade da voz costuma ser bastante alterada durante uma chamada, o que torna o reconhecimento de voz ainda mais difícil.

informação relacionada