Wie werden Videodateien aufgeteilt, wenn ein Sprecherwechsel erkannt wird? (d. h. verschiedene Dateien für verschiedene Sprecher)

2024-7-10 • tag-icon

Wie werden Videodateien aufgeteilt, wenn ein Sprecherwechsel erkannt wird? (d. h. verschiedene Dateien für verschiedene Sprecher)

Ich habe eine Audiodatei mit zwei Sprechern. Die Audiodatei enthält ein Gespräch zwischen den beiden. Ich möchte die Datei in zwei Teile aufteilen. Ein Teil sollte das Gespräch von Person A enthalten und der andere das Gespräch von Person B.

Ich habe versucht, die Trennung im Stummmodus durchzuführen, aber es funktioniert nicht. Ich habe es mit den folgenden Befehlen versucht.

„ffmpeg -i input.wav -af silencedetect=noise=-30dB:d=0.2 -f null - 2> vol.txt“

Aber meine Audiodatei hat auch einige zufällige Pausen. Diese Lösung funktioniert also nicht. Ich muss zwischen den Sprechern unterscheiden. Irgendwelche Vorschläge, wie ich das machen kann?

verwandte Informationen