Como dividir arquivos de vídeo após detecção de alteração nos alto-falantes? (ou seja, arquivo diferente para alto-falante diferente)

Como dividir arquivos de vídeo após detecção de alteração nos alto-falantes? (ou seja, arquivo diferente para alto-falante diferente)

Eu tenho um arquivo de áudio que possui 2 alto-falantes. O arquivo de áudio contém uma conversa entre eles. Quero dividir esse arquivo em 2 partes. Uma parte deve conversar com a Pessoa A e a outra deve conversar com a Pessoa B.

Tentei dividir no silêncio, mas não funciona. Eu tentei usando os comandos abaixo.

"ffmpeg -i input.wav -af silenciadetect=ruído=-30dB:d=0,2 -f null - 2> vol.txt"

Mas meu arquivo de áudio também tem algumas pausas aleatórias. Portanto, esta solução não está funcionando. preciso diferenciar os alto-falantes. Alguma sugestão para fazer isso?

informação relacionada