Estou procurando um software que me permita inserir um arquivo de áudio (.wav .mp3...) e gerar o texto do arquivo de áudio.
Esse software existe? Encontrei apenas software que converte voz (ao vivo) em texto, mas não arquivos de áudio em texto.
Responder1
Não conheço nenhum que você possa baixar, mas posso fazer uma sugestão desajeitada.
O Google criou esse software, eu sei que eles o usam no YouTube e no Google Voice.
Isso énão muito bom, mas você pode ligar para sua conta do Google Voice, deixar a secretária eletrônica atender e reproduzir o áudio enquanto seu correio de voz é gravado.
Você receberá uma transcrição do correio de voz em seu e-mail.
Só sugiro isso porque você não precisa treinar o mecanismo do Google.
Responder2
Isso não responde especificamente à sua pergunta, mas o que eu faria na sua situação é distribuí-lo como um trabalho do Amazon Mechanical Turk. Você provavelmente obterá os melhores resultados e pagará menos dinheiro dessa maneira.
Responder3
eMicrophones fabrica um produto comercial chamadoKit de ferramentas de reconhecimento de fala do Windowsisso adiciona muitas vantagens ao Reconhecimento de Fala do Windows, incluindo a capacidade de transcrever arquivos *.WAV (desde que sejam seus, ou seja, uma gravação como se você estivesse falando, e não uma voz arbitrária). Da lista de recursos:
Transcriçãolê arquivos .WAV de um gravador digital e os transcreve em texto. Destina-se a ser utilizado por quem possui um perfil de usuário pessoal e dita como faria na frente do computador, usando boa enunciação e pontuação. Não se destina a transcrever várias vozes de uma reunião.
Responder4
Existe um projeto de software chamado 'fanscribe' que divide uma gravação e a divide em pedaços, distribuindo-os para pessoas interessadas que podem transcrever uma parte dela.
https://github.com/fanscribed/fanscribed/blob/master/README.rst