
書かれたテキストからオーディオ ファイルを作成するツールはありますか (これは音声をテキストに変換するものではありません)。これを行うツールは多数ありますが、タイムスタンプ ベースのツールは見つかりませんでした。
すでに字幕/cc ファイルがあるので、それらの既存のファイルを使用したいと思います。タイミングを考慮する必要があります。次のようになります。
00:13 Say this
00:17 Say something else
したがって、13 秒後に最初のテキストが読み上げられ、17 秒後に 2 番目のテキストが読み上げられるはずです。