Python を使用して曲内の単語を見つけることはできますか?

Python を使用して曲内の単語を見つけることはできますか?

私はPython初心者です。単語が歌の一部であるかどうかを調べたいです

例えば、

「ジョニー ジョニー はいパパ、砂糖を食べないパパ」という韻文を MP3 または WAV ファイルで持っています。

入力として「sugar」という単語と 0 ~ 5 秒の時間を指定します。指定された 5 秒以内に sugar という単語が出てくるかどうかを確認することは可能ですか?

これについてどうか助けてください。

ありがとう、ショバ

答え1

あなたの側で多大な努力がなければ、それは不可能です。

ほとんどの音声認識アルゴリズムは、歌ではなく通常の会話用に調整されています。歌の中の単語を認識するのははるかに難しく (人間にとっても!)、そのためのアルゴリズムはまだ非常に実験的です。(2010年の研究プロジェクト例えば、無伴奏の歌では単語の39%しか正しく認識できず、伴奏付きの歌では認識率がさらに低下した。

関連情報