Почему программное обеспечение для аудиодиктовки, такое как Dragon, работает только со стороны говорящего?

Почему программное обеспечение для аудиодиктовки, такое как Dragon, работает только со стороны говорящего?

Я не хочу, чтобы мой ноутбук или мобильный телефон просто диктовал/печатал то, что я говорю, а вместо этого записывал то, что говорит звонящий на другом конце провода. Почему Google или Nuance не предоставляют такую ​​функцию? Возможно ли это вообще? Что нужно для этого?

решение1

Когда вы говорите, ваш голос записывается через микрофон и аудиооборудование вашего компьютера. Этот аудиосигнал доступен для любых приложений на вашем компьютере. Когда вы разговариваете с кем-то по Skype, голосовой сигнал кодируется в кучу пакетов. Вам нужно будет выполнить обратную разработку протокола Skype, чтобы расшифровать голосовой сигнал.

Если вы разговариваете по мобильному телефону в режиме громкой связи, качество может быть недостаточно хорошим для распознавания голоса. Кроме того, программное обеспечение для распознавания голоса должно быть обучено как на вашем голосе, так и на голосе другого человека.

Я не уверен, какое отношение здесь имеет Google.

решение2

Dragon NaturallySpeaking (в отличие от Google) требует обучения, прежде чем сможет преобразовывать речь в слова.

Google преобразует речь в текст для звонящего на другом конце линии, когда кто-то оставляет сообщение на вашем автоответчике в Google Voice.

Обратите внимание, что качество голоса во время разговора часто существенно меняется, что еще больше затрудняет распознавание голоса.

Связанный контент