저는 음성을 텍스트로 변환하고 텍스트를 음성으로 변환하는 앱을 만들려고 합니다. Google과 IBM의 모듈을 사용해 보았는데, 오프라인에서 사용할 수 있는 다른 모듈을 제안해 주실 수 있나요?
답변1
다음은 Python에서 지원하는 음성 인식 모듈 또는 라이브러리이며 오프라인에서 사용할 수 있는 라이브러리에 대해서도 언급했습니다. 이것을 통과해주세요문서자세한 내용은
- CMU 스핑크스(오프라인에서 작동)
- Google 음성 인식
- Google 클라우드 음성 API
- Wit.ai
- 마이크로소프트 애저 스피치
- Microsoft Bing 음성 인식(더 이상 사용되지 않음)
- 하운디파이 API
- IBM 음성 텍스트 변환
- Snowboy 핫워드 감지(오프라인에서 작동)
- 텐서플로우
- Vosk API(오프라인에서 작동)
- OpenAI 속삭임(오프라인에서 작동)
답변2
뻔뻔한 플러그인 :)
Picovoice는 또한 장치 내에서 음성 데이터를 처리하며 무료 계층은 매월 6000분(100시간)을 제공합니다. https://picovoice.ai/
다음은 3줄의 Python이 포함된 STT 튜토리얼입니다. https://picovoice.ai/blog/transcribe-speech-to-text-with- three-lines-of-python/
-피코보이스에서 근무