Я не хочу, чтобы мой ноутбук или мобильный телефон просто диктовал/печатал то, что я говорю, а вместо этого записывал то, что говорит звонящий на другом конце провода. Почему Google или Nuance не предоставляют такую функцию? Возможно ли это вообще? Что нужно для этого?
решение1
Когда вы говорите, ваш голос записывается через микрофон и аудиооборудование вашего компьютера. Этот аудиосигнал доступен для любых приложений на вашем компьютере. Когда вы разговариваете с кем-то по Skype, голосовой сигнал кодируется в кучу пакетов. Вам нужно будет выполнить обратную разработку протокола Skype, чтобы расшифровать голосовой сигнал.
Если вы разговариваете по мобильному телефону в режиме громкой связи, качество может быть недостаточно хорошим для распознавания голоса. Кроме того, программное обеспечение для распознавания голоса должно быть обучено как на вашем голосе, так и на голосе другого человека.
Я не уверен, какое отношение здесь имеет Google.
решение2
Dragon NaturallySpeaking (в отличие от Google) требует обучения, прежде чем сможет преобразовывать речь в слова.
Google преобразует речь в текст для звонящего на другом конце линии, когда кто-то оставляет сообщение на вашем автоответчике в Google Voice.
Обратите внимание, что качество голоса во время разговора часто существенно меняется, что еще больше затрудняет распознавание голоса.