본문 바로가기

AI/Generative Video8

VLOGGER VLOGGER는 사람의 한 장의 이미지만으로도 음성에 기반한 비디오를 생성하는 새로운 방법입니다. 이 방법은 1) 사람의 움직임을 3D로 표현하는 확률적 diffusion 모델과 2) 얼굴과 몸의 표현을 통해 제어가 가능한 새로운 diffusion 기반 구조로 구성되어 있습니다. 기존 방법과 달리 각 사람의 트레이닝이 필요없고, 얼굴 인식이나 자르기가 없어도 전체 이미지를 만들며 다양한 시나리오 (몸통이 보이거나 사람의 특성이 다양한 경우 등) 에서도 적용가능합니다. MENTOR라는 새로운 데이터셋을 만들었는데, 이는 기존 데이터셋보다 10배 크고 (80만 명), 다양한 제스처가 포함되어 있습니다. 이를 통해 VLOGGER의 주요 기술적 기여도를 측정했습니다. VLOGGER는 이미지 퀄리티, 얼굴 인식 .. 2024. 4. 18.
i2vgen-xl https://github.com/damo-vilab/i2vgen-xl GitHub - damo-vilab/i2vgen-xl: Official repo for VGen: a holistic video generation ecosystem for video generation building on di Official repo for VGen: a holistic video generation ecosystem for video generation building on diffusion models - GitHub - damo-vilab/i2vgen-xl: Official repo for VGen: a holistic video generation ... github.com https://github.co.. 2023. 12. 17.
DreaMoving https://github.com/dreamoving/dreamoving-project GitHub - dreamoving/dreamoving-project: Official implementation of DreaMoving Official implementation of DreaMoving. Contribute to dreamoving/dreamoving-project development by creating an account on GitHub. github.com https://dreamoving.github.io/dreamoving/ DreaMoving Project page for DreaMoving. dreamoving.github.io 얼굴이 깨지지 않으면서 동작을 생성할수 있음. htt.. 2023. 12. 17.
CoDeF CoDeF: Content Deformation Fields for Temporally Consistent Video Processing 코렙에서 바로 해볼수... https://qiuyu96.github.io/CoDeF/ CoDeF We present the content deformation field (CoDeF) as a new type of video representation, which consists of a canonical content field aggregating the static contents in the entire video and a temporal deformation field recording the transformations from the qiuyu96.git.. 2023. 8. 20.