Ich suche nach einer Software, mit der ich eine Audiodatei (.wav, .mp3...) eingeben und den Text der Audiodatei ausgeben kann.
Gibt es eine solche Software? Ich habe nur Software gefunden, die (Live-)Sprache in Text umwandelt, aber keine Audiodateien in Text.
Antwort1
Ich kenne keine, die Sie herunterladen können, aber ich kann Ihnen einen groben Vorschlag machen.
Google hat eine solche Software entwickelt und ich weiß, dass sie sie bei YouTube und Google Voice verwenden.
Es istnicht sehr gut, aber Sie können Ihr Google Voice-Konto anrufen, den Anrufbeantworter abnehmen lassen und den Ton abspielen, während Ihre Voicemail aufgezeichnet wird.
Sie erhalten eine Abschrift der Voicemail per E-Mail.
Ich schlage dies nur vor, weil Sie die Engine von Google nicht trainieren müssen.
Antwort2
Dies beantwortet Ihre Frage zwar nicht im Einzelnen, aber ich würde es in Ihrer Situation als Amazon Mechanical Turk-Job vertreiben. Auf diese Weise erzielen Sie wahrscheinlich die besten Ergebnisse und zahlen am wenigsten Geld.
Antwort3
eMicrophones stellt ein kommerzielles Produkt her, genanntWindows-Spracherkennungs-Toolkitdas erweitert die Windows-Spracherkennung um viele Extras, darunter die Möglichkeit, *.WAV-Dateien zu transkribieren (vorausgesetzt, sie stammen von Ihnen, d. h. es handelt sich um eine Aufnahme, als ob Sie sprechen würden, und nicht um eine beliebige Stimme). Aus der Funktionsliste:
Transkriptionliest WAV-Dateien von einem digitalen Rekorder und transkribiert sie in Text. Dies ist für die Verwendung durch Personen gedacht, die ein persönliches Benutzerprofil haben und mit guter Aussprache und Zeichensetzung diktieren, als ob sie vor dem Computer wären. Es ist nicht für die Transkription mehrerer Stimmen aus einer Besprechung gedacht.
Antwort4
Es gibt ein Softwareprojekt namens „Fanscribe“, das Aufnahmen in Einzelteile zerlegt und diese an interessierte Personen verteilt, die einen Teil davon transkribieren können.
https://github.com/fanscribed/fanscribed/blob/master/README.rst