본문 바로가기

AI/STT, TTS10

OpenVoice https://github.com/myshell-ai/OpenVoice GitHub - myshell-ai/OpenVoice: Instant voice cloning by MyShell. Instant voice cloning by MyShell. Contribute to myshell-ai/OpenVoice development by creating an account on GitHub. github.com 2024. 1. 7.
Distil-Whisper Distil-Whisper GitHub - huggingface/distil-whisper: Distilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% word Distilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% word error rate. - GitHub - huggingface/distil-whisper: Distilled variant of Whisper for speech recognition. 6... github.com Whisper보다 6배 빠른 오픈소스 [Paper] [Models] [Col.. 2023. 11. 5.
Whisper JAX Whisper JAX - up to 70x faster than OpenAI Whisper Whisper를 그래픽 가속을 했더니 70배 빨라졌다고 합니다. https://github.com/sanchit-gandhi/whisper-jax GitHub - sanchit-gandhi/whisper-jax Contribute to sanchit-gandhi/whisper-jax development by creating an account on GitHub. github.com https://github.com/openai/whisper/discussions/1277 2023. 5. 1.
사람과 같은 수준의 TTS(Tex-to-Speech) 오픈소스 사람과 같은 수준의 TTS(Tex-to-Speech) 오픈소스를 찾고 있다면, 다음과 같은 프로젝트들을 추천해 드립니다. Mozilla TTS (Tacotron 2) 깃허브 주소: https://github.com/mozilla/TTS Mozilla TTS는 딥러닝 기반의 TTS 프로젝트로 Tacotron 2 모델을 사용합니다. 이 프로젝트는 오픈소스로 개발되어 있으며, 사용자들이 자신만의 TTS 모델을 훈련시킬 수 있도록 지원합니다. FastSpeech 2 깃허브 주소: https://github.com/ming024/FastSpeech2 FastSpeech 2는 기존 Tacotron 2와 같은 모델보다 더 빠른 합성 속도를 제공하는 프로젝트입니다. 이 프로젝트는 적은 데이터로도 효과적인 TTS를 생성.. 2023. 4. 3.