Python을 사용하여 노래에서 단어를 찾을 수 있습니까?

Python을 사용하여 노래에서 단어를 찾을 수 있습니까?

저는 파이썬을 처음 접했습니다. 단어가 노래의 일부인지 확인하고 싶습니다.

예를 들어,

mp3 또는 wav 파일로 "johnny johnny yes papa, eating sugar no papa" 운율이 있는 경우.

"설탕"이라는 단어와 시간을 0~5초로 입력하겠습니다. 주어진 5초 안에 설탕 단어가 나오는지 확인할 수 있나요?

친절하게 도와주세요.

고마워요, 쇼바

답변1

귀하의 노력이 많이 필요하지 않은 것은 아닙니다.

대부분의 음성 인식 알고리즘은 노래가 아닌 일반적인 음성에 맞춰 조정되어 있습니다. 노래 속 단어를 인식하는 것은 훨씬 더 어렵고(심지어 인간에게도!) 그렇게 하는 알고리즘은 여전히 ​​매우 실험적입니다. (2010년 연구 프로젝트예를 들어, 반주 없는 노래에서는 단어의 39%만 정확하게 인식할 수 있었습니다. 반주와 함께 노래할 경우 인식률이 더욱 떨어졌습니다.)

관련 정보