texture1 Scaling up GANs for Text-to-Image Synthesis GigaGAN: 텍스트-이미지 합성을 위한 대규모 GAN 일반 텍스트-이미지 합성 작업을 위해 대규모 데이터 세트에서 GAN을 교육할 수도 있습니까? 우리는 Stable Diffusion v1.5, DALL·E 2 및 Parti-750M보다 낮은 FID를 달성하는 1B 매개변수 GigaGAN을 제시합니다. 0.13s에서 512px 출력을 생성하며, 확산 및 자동 회귀 모델보다 몇 배 더 빠르고, GAN의 분리되고 연속적이며 제어 가능한 잠재 공간을 상속합니다. 또한 텍스트-이미지 모델의 저해상도 출력에서 4K 이미지를 생성할 수 있는 빠른 업샘플러를 교육합니다. https://youtube.com/shorts/_eDwU-GQcKo GigaGAN은 분리되고 연속적이며 제어 가능한 잠재 공간을 제공합니다.. 2023. 3. 14. 이전 1 다음