스피커의 변화가 감지되면 비디오 파일을 분할하는 방법은 무엇입니까? (즉, 화자마다 다른 파일)

스피커의 변화가 감지되면 비디오 파일을 분할하는 방법은 무엇입니까? (즉, 화자마다 다른 파일)

스피커가 2개 있는 오디오 파일이 있습니다. 오디오 파일에는 그들 사이의 대화가 있습니다. 해당 파일을 두 부분으로 나누고 싶습니다. 한 부분은 A 사람의 대화가 있어야 하고 다른 부분은 B 사람의 대화가 있어야 합니다.

무음으로 분할하려고 시도했지만 작동하지 않습니다. 아래 명령을 사용하여 시도했습니다.

"ffmpeg -i input.wav -af SilentDetect=noise=-30dB:d=0.2 -f null - 2> vol.txt"

하지만 내 오디오 파일에도 임의의 일시 중지가 있습니다. 따라서 이 솔루션은 작동하지 않습니다. 스피커를 구별해야 해요. 이렇게 하라는 제안이 있나요?

관련 정보