話者の変更が検出されたときにビデオ ファイルを分割するにはどうすればよいですか? (つまり、話者ごとに異なるファイル)

話者の変更が検出されたときにビデオ ファイルを分割するにはどうすればよいですか? (つまり、話者ごとに異なるファイル)

2 人のスピーカーの音声ファイルがあります。音声ファイルには、2 人のスピーカー間の会話が含まれています。このファイルを 2 つの部分に分割します。1 つの部分には人物 A の会話が含まれ、もう 1 つの部分には人物 B の会話が含まれます。

サイレントで分割しようとしましたが、機能しません。以下のコマンドを使用して試しました。

「ffmpeg -i input.wav -af silentdetect=noise=-30dB:d=0.2 -f null - 2> vol.txt」

しかし、私のオーディオ ファイルにもランダムな一時停止があります。したがって、この解決策は機能しません。スピーカーを区別する必要があります。これを行うための提案はありますか?

関連情報