AI140 Stable Audio https://stability.ai/research/stable-audio-efficient-timing-latent-diffusion Stable Audio: Fast Timing-Conditioned Latent Audio Diffusion — Stability AI Stable Audio represents the cutting-edge audio generation research by Stability AI’s generative audio research lab, Harmonai. We continue to improve our model architectures, datasets, and training procedures to improve output quality, controllab.. 2023. 9. 17. ChatGPT dataset https://github.com/voidful/awesome-chatgpt-dataset GitHub - voidful/awesome-chatgpt-dataset: Unlock the Power of LLM: Explore These Datasets to Train Your Own ChatGPT! Unlock the Power of LLM: Explore These Datasets to Train Your Own ChatGPT! - GitHub - voidful/awesome-chatgpt-dataset: Unlock the Power of LLM: Explore These Datasets to Train Your Own ChatGPT! github.com https://huggingface.co/da.. 2023. 9. 14. SMPLitex pose with style과 비슷한 방식으로 접근 하였으며 결과를 3D모델에 적용하여 애니메이션까지 진행한듯합니다. https://dancasas.github.io/projects/SMPLitex/index.html SMPLitex: A Generative Model and Dataset for 3D Human Texture Estimation from Single Image (BMVC 2023) Abstract We propose SMPLitex, a method for estimating and manipulating the complete 3D appearance of humans captured from a single image. SMPLitex builds upon the recently p.. 2023. 9. 7. DINOv2 DINOv2: 자체 감독 비전 변환기 모델 이미지 수준의 시각적 작업 (이미지 분류, 인스턴스 검색, 비디오 이해)과 픽셀 수준의 시각적 작업 (깊이 추정, 의미론적 분할) 에 적합한 범용 기능을 생성하는 기초 모델 제품군입니다 . DINOv2 모델은 다양한 컴퓨터 비전 작업에서 선형 레이어만큼 간단한 분류기와 함께 직접 사용할 수 있는 고성능 시각적 기능을 생성합니다. 이러한 시각적 기능은 강력하며 미세 조정 요구 사항 없이 여러 도메인에서 잘 작동합니다. 모델은 라벨이나 주석을 사용하지 않고 142M 이미지 데이터 세트에서 사전 학습되었습니다. 모든 프레임의 패치 기능에 대한 세 가지 첫 번째 주요 구성 요소를 RGB 값에 매핑하여 시각화합니다. 데모 : https://dinov2.metademola.. 2023. 9. 3. 이전 1 ··· 12 13 14 15 16 17 18 ··· 35 다음