如何在偵測到揚聲器變化時分割視訊檔案? (即不同的說話者有不同的文件)

如何在偵測到揚聲器變化時分割視訊檔案? (即不同的說話者有不同的文件)

我有一個有 2 個揚聲器的音訊檔案。音訊檔案有他們之間的對話。我想將該文件分成兩部分。一部分應與 A 對話,另一部分應與 B 對話。

我嘗試過以靜音方式進行拆分,但不起作用。我嘗試過使用以下命令。

“ffmpeg -i input.wav -af SilenceDetect=noise=-30dB:d=0.2 -f null - 2> vol.txt”

但我的音訊檔案也有一些隨機暫停。所以這個解決方案不起作用。我需要區分說話者。有什麼建議可以這樣做嗎?

相關內容