본문 바로가기

분류 전체보기220

StructLDM: Structured Latent Diffusion for 3D Human Generation 최근 3D 인간 생성 모델은 2D 이미지에서 3D 인식 GAN을 학습함으로써 놀라운 발전을 이루었습니다. 그러나 기존의 3D 인간 생성 방법은 인간 신체 토폴로지의 관절 구조와 의미를 무시하고 컴팩트한 1D 잠재 공간에서 인간을 모델링합니다. 본 논문에서는 3D 인간 모델링을 위해 보다 표현력이 풍부하고 고차원적인 잠재 공간을 탐구하고 2D 이미지로부터 학습되는 확산 기반 무조건 3D 인간 생성 모델인 StructLDM을 제안합니다. StructLDM은 세 가지 주요 설계를 통해 잠재 공간의 고차원 성장으로 인해 발생하는 문제를 해결합니다. 1) 통계적 인체 템플릿의 조밀한 표면 다양체에 정의된 의미론적 구조의 잠재 공간. 2) 전역 잠재 공간을 본문 템플릿에 고정된 조건부 구조화된 로컬 NeRF 세트에.. 2024. 4. 9.
an adorable cartoon style cat Stable Diffusion Web UI https://github.com/AUTOMATIC1111/stable-diffusion-webui Huggingface SD 1.5 https://huggingface.co/runwayml/stable-diffusion-v1-5 GFPGAN https://github.com/TencentARC/GFPGAN DALLE2 Prompt Book https://dallery.gallery/the-dalle-2-prompt-book/ Stable Diffusion Prompt Book https://openart.ai/promptbook lexica https://lexica.art/ Colab Pro notebook from https://github.com/TheL.. 2024. 4. 2.
OpenVoice 입력한 목소리로 TTS 처리해줌. 논문 : https://arxiv.org/abs/2312.01479 소스: https://github.com/myshell-ai/OpenVoice 웹 : https://research.myshell.ai/open-voice Open Voice OpenVoice: Versatile Instant Voice Cloning We introduce OpenVoice, a versatile instant voice cloning approach that requires only a short audio clip from the reference speaker to replicate their voice and generate speech in multiple languages. .. 2024. 4. 1.
A New 3D Digital Human Creator For All! Meshcapade는 디지털 인간이 주변 세계를 움직이고 이해할 수 있도록 하는 기술을 만드는 회사입니다. 이 회사는 플랫폼, API 및 기타 기술 기능을 제공합니다. Meshcapade의 플랫폼은 사용자가 디지털 인간을 만들 수 있도록 합니다. 플랫폼에는 텍스트에서 모션, 비디오에서 모션, 이미지에서 신체 모양과 같은 기능이 포함되어 있습니다. Meshcapade의 기술은 다양한 애플리케이션에 사용될 수 있습니다. 예를 들어, 게임, 영화, 교육 및 의료에 사용할 수 있습니다. 디지털 인간의 미래를 형성하는 데 도움이 될 잠재력이 있는 회사입니다. https://meshcapade.com/ Meshcapade | The Digital Human Company Foundation models that e.. 2024. 3. 25.