Я ищу программное обеспечение, которое позволило бы мне вводить аудиофайл (.wav .mp3...) и выводить текст аудиофайла.
Существует ли такое ПО? Я нашел только ПО, которое преобразует (живой) голос в текст, но не аудиофайлы в текст.
решение1
Я не знаю ни одной, которую можно было бы скачать, но могу дать одно неуклюжее предложение.
Google создала такое программное обеспечение, я знаю, что оно используется в YouTube и Google Voice.
Егоне очень хорошо, но вы можете позвонить на свой аккаунт Google Voice, дождаться ответа автоответчика и воспроизвести аудио, пока записывается ваша голосовая почта.
Транскрипцию голосового сообщения вы получите по электронной почте.
Я предлагаю это только потому, что вам не придется обучать поисковую систему Google.
решение2
Это не отвечает конкретно на ваш вопрос, но то, что я бы сделал в вашей ситуации, это распространил бы это как работу Amazon Mechanical Turk. Вы, вероятно, получите лучшие результаты и заплатите меньше всего долларов таким образом.
решение3
eMicrophones выпускает коммерческий продукт под названиемНабор инструментов распознавания речи Windowsчто добавляет много полезного в Windows Speech Recognition, включая возможность транскрибировать файлы *.WAV (при условии, что они принадлежат вам, т.е. запись, как будто вы говорите, а не произвольный голос). Из списка функций:
Транскрипциясчитывает файлы .WAV с цифрового диктофона и транскрибирует их в текст. Это предназначено для использования человеком, имеющим личный профиль пользователя и диктующим так, как он это делал бы перед компьютером, используя хорошую дикцию и пунктуацию. Это не предназначено для транскрибирования нескольких голосов с собрания.
решение4
Существует программный проект под названием «fanscribe», который разбивает запись на части и распространяет их среди заинтересованных людей, которые могут расшифровать ее часть.
https://github.com/fanscribed/fanscribed/blob/master/README.rst