본문 바로가기

AI137

VLOGGER VLOGGER는 사람의 한 장의 이미지만으로도 음성에 기반한 비디오를 생성하는 새로운 방법입니다. 이 방법은 1) 사람의 움직임을 3D로 표현하는 확률적 diffusion 모델과 2) 얼굴과 몸의 표현을 통해 제어가 가능한 새로운 diffusion 기반 구조로 구성되어 있습니다. 기존 방법과 달리 각 사람의 트레이닝이 필요없고, 얼굴 인식이나 자르기가 없어도 전체 이미지를 만들며 다양한 시나리오 (몸통이 보이거나 사람의 특성이 다양한 경우 등) 에서도 적용가능합니다. MENTOR라는 새로운 데이터셋을 만들었는데, 이는 기존 데이터셋보다 10배 크고 (80만 명), 다양한 제스처가 포함되어 있습니다. 이를 통해 VLOGGER의 주요 기술적 기여도를 측정했습니다. VLOGGER는 이미지 퀄리티, 얼굴 인식 .. 2024. 4. 18.
Udio 음악을 생성해보자 구글에서 일냈다. https://www.udio.com/ Udio | Make your music Discover, create, and share music with the world. www.udio.com 2024. 4. 17.
IPADATER PLUS를 활용해 의상을 변경해보자 https://arxiv.org/html/2403.01779v1 https://github.com/AuroBit/ComfyUI-OOTDiffusion GitHub - AuroBit/ComfyUI-OOTDiffusion: ComfyUI custom node that simply integrates the OOTDiffusion. ComfyUI custom node that simply integrates the OOTDiffusion. - AuroBit/ComfyUI-OOTDiffusion github.com https://github.com/levihsu/OOTDiffusion?tab=readme-ov-file GitHub - levihsu/OOTDiffusion: Official implementati.. 2024. 4. 17.
an adorable cartoon style cat Stable Diffusion Web UI https://github.com/AUTOMATIC1111/stable-diffusion-webui Huggingface SD 1.5 https://huggingface.co/runwayml/stable-diffusion-v1-5 GFPGAN https://github.com/TencentARC/GFPGAN DALLE2 Prompt Book https://dallery.gallery/the-dalle-2-prompt-book/ Stable Diffusion Prompt Book https://openart.ai/promptbook lexica https://lexica.art/ Colab Pro notebook from https://github.com/TheL.. 2024. 4. 2.