본문 바로가기

전체 글251

Whisper JAX Whisper JAX - up to 70x faster than OpenAI Whisper Whisper를 그래픽 가속을 했더니 70배 빨라졌다고 합니다. https://github.com/sanchit-gandhi/whisper-jax GitHub - sanchit-gandhi/whisper-jax Contribute to sanchit-gandhi/whisper-jax development by creating an account on GitHub. github.com https://github.com/openai/whisper/discussions/1277 2023. 5. 1.
TTS - Bark 음성 대화에 필요한 3가지 AI가 모두 공개 되었습니다. TTS모델 Bark 공개. 깃헙: https://github.com/suno-ai/bark 코랩: https://colab.research.google.com/drive/1Ot22n5fWZ6YiFP_xXD5Ji2GB2OSbrDH_?usp Fork 프로젝트들: git fork된 것을 사용해서 업그레이드 및 기능추가 webui : https://github.com/Fictiverse/bark 15초 이상 지원 : https://github.com/JonathanFly/bark 보이스 클로닝 : https://github.com/serp-ai/bark-with-voice-clone 라이센스: 코드 자체는 무료이나 현 버전은 상업적목적으로 사용하려는 경우.. 2023. 5. 1.
Blazepose 3d Avatar Simple Mediapipe의 unity version으로 Blazepose가 있습니다. https://github.com/homuler/MediaPipeUnityPlugin 간단하게 3D Avatar에게 적용해 본코드 입니다. Avatar는 https://www.mixamo.com/ 에서 T포즈를 하고 있는 x bot.fbx를 다운받아서 사용했습니다. using System.Collections; using System.Collections.Generic; using Mediapipe; using Mediapipe.Unity; using UnityEngine; public class Test : MonoBehaviour { public Transform LeftForearm; public Transform Lef.. 2023. 5. 1.
TTS 글자를 음성으로 생성해주는데 효과음등과 주변음 등도 생성해주는 모델이 나왔습니다. https://tango-web.github.io/ Text-to-Audio Generation using Instruction Tuned LLM and Latent Diffusion Model Deepanway Ghosal1, Navonil Majumder1, Ambuj Mehrish1, Soujanya Poria1 1DeCLaRe Lab, Singapore University of Technology and Design, Singapore Abstract The immense scale of the recent large language models (LLM) allows many interesting propertie.. 2023. 5. 1.