sox: 無音時に音声を分割するが、無音のままにする

Question 1

少し変更するだけで、分割された部分の無音部分をすべて保持できます。元のコマンドから始めます。

silence 1 0.5 0.1%   1 0.5 0.1%

最初の 3 つの値の組み合わせは、開始時に無音部分があれば、0.1% を超える音が 0.5 秒続くまで削除することを意味します。2 番目の 3 つの値の組み合わせは、0.1% 未満の無音部分が少なくとも 0.5 秒続いたときに停止することを意味します。コマンドの残りの部分は: newfile : restart、新しい出力ファイルを開始し、開始時にサウンドの検索を再開します。したがって、最初のファイルは無音部分が始まると終了し、2 番目のファイルは無音部分が終了すると開始します。

これを改善する最も簡単なオプションはですsilence -l。これは、ファイルの終わりをトリガーした 0.5 秒の無音部分を保存します。残念ながら、それより長い無音部分は、次のファイルの始まりとなるため削除されます。より長いギャップを維持する簡単な方法は、-lより長い検出時間 (例: 2 秒) と組み合わせることです。

silence -l  1 0.5 0.1%   1 2.0 0.1%

これで、少なくとも 2 秒間の無音がある場合にのみ分割されますが、ギャップの最初の 2 秒間は保持されます。すべての無音を失わないようにするには、開始時に無音の検出を削除するだけです。3 連符を 1 行に置き換える必要があります0。

silence -l  0   1 2.0 0.1%

が状況をどのように処理するかを確認するために、単純なサウンドファイルで試してみたい場合はsox、1 秒間のトーンと 1 秒間の無音で構成される 2 つのサウンドファイルを簡単に作成し、必要に応じてそれらを結合してから、エフェクトへの入力として結果を提示することができますsilence。たとえば、次を作成します。

sox -n gap.wav   trim 0 1
sox -n tone.wav  synth 1.001t sine C5

次に、gap-tone-gap-tone を結合し、out.wavエフェクトを使用して作成し、結果を聞きます。

sox gap.wav tone.wav gap.wav tone.wav out.wav silence 1 0.5 0.1%
play out.wav

Answer