すでに録音した音声をテキストに変換するにはどうすればよいですか?

すでに録音した音声をテキストに変換するにはどうすればよいですか?

オーディオ ファイル (.wav .mp3...) を入力し、オーディオ ファイルのテキストを出力できるソフトウェアを探しています。

そのようなソフトウェアは存在しますか? 音声 (ライブ) をテキストに変換するソフトウェアは見つかりましたが、オーディオ ファイルをテキストに変換するソフトウェアは見つかりませんでした。

答え1

ダウンロードできるものは知りませんが、ちょっとした提案をすることはできます。

Google はそのようなソフトウェアを開発しており、YouTube や Google Voice で使用されていることは知っています。

そのあまりよくないただし、Google Voice アカウントに電話をかけ、留守番電話サービスに応答してもらい、ボイスメールが録音されている間に音声を再生することができます。

ボイスメールの書き起こしがメールで届きます。

これを提案するのは、Google のエンジンをトレーニングする必要がないからです。

答え2

これはあなたの質問に具体的に答えているわけではありませんが、あなたの状況では、Amazon Mechanical Turk ジョブとして配布することをお勧めします。この方法であれば、おそらく最良の結果が得られ、支払う金額も最小限に抑えられるでしょう。

答え3

eMicrophonesは、Windows 音声認識ツールキットこれにより、Windows 音声認識に多くの機能が追加され、*.WAV ファイルの文字起こし機能も追加されます (ただし、そのファイルがユーザーからのものであること、つまり、任意の音声ではなく、ユーザーが話しているかのような録音であることが条件です)。機能一覧から:

転写デジタル レコーダーから .WAV ファイルを読み取り、テキストに書き起こします。これは、個人ユーザー プロファイルを持ち、コンピューターの前で正しい発音と句読点を使用して口述するのと同じように使用するユーザーを対象としています。会議の複数の音声を書き起こすためのものではありません。

答え4

「fanscribe」と呼ばれるソフトウェア プロジェクトがあり、録音を分割して断片化し、興味のある人に配布して、その一部を書き起こしてもらうことができます。

https://github.com/fanscribed/fanscribed/blob/master/README.rst

関連情報