話者の変更が検出されたときにビデオファイルを分割するにはどうすればよいですか? (つまり、話者ごとに異なるファイル)

2024-7-10 • tag-icon

2 人のスピーカーの音声ファイルがあります。音声ファイルには、2 人のスピーカー間の会話が含まれています。このファイルを 2 つの部分に分割します。1 つの部分には人物 A の会話が含まれ、もう 1 つの部分には人物 B の会話が含まれます。

サイレントで分割しようとしましたが、機能しません。以下のコマンドを使用して試しました。

「ffmpeg -i input.wav -af silentdetect=noise=-30dB:d=0.2 -f null - 2> vol.txt」

しかし、私のオーディオファイルにもランダムな一時停止があります。したがって、この解決策は機能しません。スピーカーを区別する必要があります。これを行うための提案はありますか?

関連情報