본문 바로가기
AI/STT, TTS

OpenVoice

by wenect 2024. 4. 1.

입력한 목소리로 TTS 처리해줌.

논문 : https://arxiv.org/abs/2312.01479

소스: https://github.com/myshell-ai/OpenVoice

웹 : https://research.myshell.ai/open-voice

 

Open Voice

OpenVoice: Versatile Instant Voice Cloning We introduce OpenVoice, a versatile instant voice cloning approach that requires only a short audio clip from the reference speaker to replicate their voice and generate speech in multiple languages. OpenVoice ena

research.myshell.ai

1. 정확한 톤 컬러 복제. OpenVoice는 기준음 색상을 정확하게 복제하고 여러 언어와 악센트로 음성을 생성할 수 있습니다.

2. 유연한 음성 스타일 제어. OpenVoice를 사용하면 감정, 억양과 같은 음성 스타일은 물론 리듬, 일시 정지, 억양 등 기타 스타일 매개변수를 세밀하게 제어할 수 있습니다.

3. 제로샷 교차 언어 음성 복제. 생성된 음성

https://github.com/camenduru/OpenVoice-colab

 

GitHub - camenduru/OpenVoice-colab

Contribute to camenduru/OpenVoice-colab development by creating an account on GitHub.

github.com

 

'AI > STT, TTS' 카테고리의 다른 글

PaliGemma  (0) 2024.05.19
facebookresearch seamless_communication  (0) 2024.01.08
OpenVoice  (0) 2024.01.07
Distil-Whisper  (0) 2023.11.05
Whisper JAX  (2) 2023.05.01

댓글