%20%D0%B4%D0%BB%D1%8F%20%D0%BE%D0%B7%D0%B2%D1%83%D1%87%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F%20.png)
Есть ли инструмент, который создает аудиофайл из написанного текста (это НЕ(!) о преобразовании речи в текст). Есть много инструментов, которые это делают, но я не нашел ни одного, который был бы основан на временных метках.
Поскольку у меня уже есть файлы subtitle/cc, я хочу использовать эти существующие файлы. И нужно учитывать время. Что-то вроде этого:
00:13 Say this
00:17 Say something else
Таким образом, через 13 секунд должен быть произнесен первый текст, а через 17 секунд — второй.