이미 녹음된 음성을 텍스트로 변환하려면 어떻게 해야 합니까?

이미 녹음된 음성을 텍스트로 변환하려면 어떻게 해야 합니까?

오디오 파일(.wav .mp3...)을 입력하고 오디오 파일의 텍스트를 출력할 수 있는 소프트웨어를 찾고 있습니다.

그러한 소프트웨어가 존재합니까? (실시간) 음성을 텍스트로 변환하는 소프트웨어만 찾았지만 오디오 파일을 텍스트로 변환하는 소프트웨어는 찾지 못했습니다.

답변1

당신이 다운로드할 수 있는 것이 무엇인지는 모르지만 투박한 제안을 드릴 수 있습니다.

Google은 그러한 소프트웨어를 구축했으며 YouTube와 Google Voice에서 사용하는 것으로 알고 있습니다.

그것은아주 좋은하지하지만 Google 보이스 계정에 전화를 걸어 자동 응답 서비스에서 전화를 받고 음성메일이 녹음되는 동안 오디오를 재생할 수 있습니다.

이메일로 음성 메일의 텍스트를 받아보실 수 있습니다.

Google 엔진을 교육할 필요가 없기 때문에 이것을 제안하는 것뿐입니다.

답변2

이것은 귀하의 질문에 구체적으로 대답하지는 않지만 귀하의 상황에서 제가 할 일은 Amazon Mechanical Turk 작업으로 배포하는 것입니다. 이 방법을 사용하면 아마도 최상의 결과를 얻을 수 있고 가장 적은 비용을 지불하게 될 것입니다.

답변3

eMicrophones는 다음과 같은 상용 제품을 만듭니다.Windows 음성 인식 도구 키트이는 *.WAV 파일을 복사하는 기능을 포함하여 Windows 음성 인식에 많은 기능을 추가합니다(즉, 임의의 음성이 아니라 사용자가 말하는 것처럼 녹음하는 경우). 기능 목록에서:

전사디지털 레코더에서 .WAV 파일을 읽고 텍스트로 복사합니다. 이는 개인 사용자 프로필을 갖고 컴퓨터 앞에서 좋은 발음과 구두점을 사용하여 지시하는 사람이 사용하도록 되어 있습니다. 회의에서 여러 목소리를 녹음하기 위한 것이 아닙니다.

답변4

녹음물을 분할하여 여러 조각으로 나누고 관심 있는 사람들에게 배포하여 일부를 복사할 수 있는 'fanscribe'라는 소프트웨어 프로젝트가 있습니다.

https://github.com/fanscribed/fanscribed/blob/master/README.rst

관련 정보