본문 바로가기

Projects18

HuMoR: 강력한 포즈 추정을 위한 3D 인간 모션 모델(ICCV 2021) HuMoR: 시간적 포즈와 모양의 견고한 추정 을 위한 3D 인간 모션 모델 을 소개 합니다 . 이번에 MIT license로 모델을 사용하는 코드가 공개되었습니다. RGB 또는 RGB-D 영상이 가능합니다. 공개자료의 결과는 매우 정교하네요 스탠퍼드 대학교, Adobe Research, 그리고 브라운 대학교에서 공동으로 진행한 프로젝트인 HuMoR에 대한 정보를 제공하고 있습니다. HuMoR은 3D 인간 동작 모델로, 임시적인 자세와 형태의 견고한 추정을 위해 개발되었습니다. 이 모델은 노이즈와 가림막이 있는 상황에서도 타당한 자세 시퀀스를 복구하는 것이 도전적인 문제로 인식하고 있습니다. 이를 위해, HuMoR은 동작 시퀀스의 각 단계에서 자세 변화의 분포를 학습하는 조건부 변분 오토인코더 형태의 발.. 2023. 6. 10.
SAM - Kadir Nar의 metaseg https://colab.research.google.com/drive/1UsuYbxb1lWbkWly_vizLPLlJ35_h0bs0#scrollTo=TH_FlG5leB1B Google Colaboratory Notebook Run, share, and edit Python notebooks colab.research.google.com 이 자습서에서는 Kadir Nar의 metaseg 라는 라이브러리를 사용하여 이미지 및 비디오 분할을 위해 Facebook SAM에 쉽게 액세스하고 사용할 수 있습니다. [ !pip install metaseg Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/.. 2023. 5. 14.
TTS - Bark 음성 대화에 필요한 3가지 AI가 모두 공개 되었습니다. TTS모델 Bark 공개. 깃헙: https://github.com/suno-ai/bark 코랩: https://colab.research.google.com/drive/1Ot22n5fWZ6YiFP_xXD5Ji2GB2OSbrDH_?usp Fork 프로젝트들: git fork된 것을 사용해서 업그레이드 및 기능추가 webui : https://github.com/Fictiverse/bark 15초 이상 지원 : https://github.com/JonathanFly/bark 보이스 클로닝 : https://github.com/serp-ai/bark-with-voice-clone 라이센스: 코드 자체는 무료이나 현 버전은 상업적목적으로 사용하려는 경우.. 2023. 5. 1.
Blazepose 3d Avatar Simple Mediapipe의 unity version으로 Blazepose가 있습니다. https://github.com/homuler/MediaPipeUnityPlugin 간단하게 3D Avatar에게 적용해 본코드 입니다. Avatar는 https://www.mixamo.com/ 에서 T포즈를 하고 있는 x bot.fbx를 다운받아서 사용했습니다. using System.Collections; using System.Collections.Generic; using Mediapipe; using Mediapipe.Unity; using UnityEngine; public class Test : MonoBehaviour { public Transform LeftForearm; public Transform Lef.. 2023. 5. 1.