Archivo de subtítulos (CC/también conocidos como subtítulos) a voz

Archivo de subtítulos (CC/también conocidos como subtítulos) a voz

¿Existe una herramienta que crea un archivo de audio a partir de texto escrito (NO se trata (!) de voz a texto). Hay muchas herramientas que hacen esto, pero no he encontrado ninguna que esté basada en marcas de tiempo.

Como ya tengo los archivos de subtítulos/cc, quiero usar esos archivos existentes. Y es necesario considerar el momento. Algo como esto:

00:13 Say this
00:17 Say something else

Entonces, después de 13 segundos, se debe pronunciar el primer texto y el segundo, después de 17 segundos.

información relacionada