Warum funktioniert Audio-Diktiersoftware wie Dragon nur auf der Sprecherseite?

Warum funktioniert Audio-Diktiersoftware wie Dragon nur auf der Sprecherseite?

Ich möchte nicht, dass mein Laptop oder Handy mir einfach diktiert/abtippt, was ich sage, sondern dass ich aufschreibe, was der Anrufer am anderen Ende der Leitung sagt. Warum ermöglichen Google oder Nuance diese Funktion nicht? Ist das überhaupt möglich? Was wäre nötig, damit das funktioniert?

Antwort1

Wenn Sie sprechen, wird Ihre Stimme über das Mikrofon und die Audio-Hardware Ihres Computers aufgezeichnet. Dieses Audiosignal steht allen Anwendungen auf Ihrem Computer zur Verfügung. Wenn Sie mit jemandem über Skype sprechen, wird das Sprachsignal in einer Reihe von Paketen codiert. Sie müssten das Skype-Protokoll zurückentwickeln, um das Sprachsignal zu decodieren.

Wenn Sie im Freisprechmodus mit einem Mobiltelefon telefonieren, ist die Qualität möglicherweise nicht gut genug für die Spracherkennung. Außerdem müsste die Spracherkennungssoftware sowohl auf Ihre Stimme als auch auf die Stimme Ihres Gesprächspartners trainiert werden.

Ich bin nicht sicher, welche Relevanz Google hier hat.

Antwort2

Dragon NaturallySpeaking muss (im Gegensatz zu Google) trainiert werden, bevor es Sprache in Worte transkribieren kann.

Wenn jemand auf Ihrem Autoresponder bei Google Voice eine Nachricht hinterlässt, wandelt Google die Sprache in Text für den Anrufer am anderen Ende der Leitung um.

Beachten Sie, dass sich die Sprachqualität während eines Telefonats oft stark verändert, was die Spracherkennung zusätzlich erschwert.

verwandte Informationen