如何將已錄製的語音轉換為文字?

如何將已錄製的語音轉換為文字?

我正在尋找一種軟體,可以讓我輸入音訊檔案(.wav .mp3...)並輸出音訊檔案的文字。

有這樣的軟體嗎?我只找到了將(即時)語音轉換為文字的軟體,但沒有找到將音訊檔案轉換為文字的軟體。

答案1

我不知道你可以下載什麼,但我可以提出一個笨拙的建議。

谷歌已經建立了這樣一個軟體,我知道他們在 YouTube 和 Google Voice 中使用它。

它是不太好,但您可以致電您的 Google 語音帳戶,讓應答服務接聽,並在錄製語音郵件時播放音訊。

您將在電子郵件中收到語音郵件的轉錄。

我建議這樣做只是因為你不必訓練谷歌的引擎。

答案2

這並沒有具體回答您的問題,但在您的情況下我會做的是將其作為 Amazon Mechanical Turk 作業分發。透過這種方式,您可能會獲得最好的結果並花費最少的錢。

答案3

eMicrophones 推出了一款名為Windows 語音辨識工具包這為 Windows 語音識別添加了許多好處,包括轉錄 *.WAV 檔案的能力(前提是它們來自您,即錄音,就像您在說話一樣,而不是任意聲音)。從功能清單來看:

轉錄從數位錄音機讀取 .WAV 檔案並將其轉錄為文字。這是供擁有個人使用者檔案並像在電腦前使用良好的發音和標點符號一樣進行口述的人使用的。它並不意味著轉錄會議中的多個聲音。

答案4

有一個名為「fanscribe」的軟體項目,可以將錄音分解成多個片段,然後將它們分發給有興趣的人,他們可以轉錄其中的一部分。

https://github.com/fanscribed/fanscribed/blob/master/README.rst

相關內容