Gibt es ein Tool, das aus geschriebenem Text eine Audiodatei erstellt (Es geht NICHT(!) um Sprache-zu-Text). Es gibt viele Tools, die das können, aber ich habe keins gefunden, das auf Zeitstempeln basiert.
Da ich bereits die Untertitel-/CC-Dateien habe, möchte ich diese vorhandenen Dateien verwenden. Und das Timing muss berücksichtigt werden. So etwas wie das hier:
00:13 Say this
00:17 Say something else
Der 1. Text sollte also nach 13 Sekunden gesprochen werden, der zweite nach 17 Sekunden.