본문 바로가기
IT New

NVIDIA 100kB 모델 크기의 개인화 이미지 생성 모델 'Perfusion' 발표

by wenect 2023. 8. 10.

NVIDIA가 최근 SIGGRAPH 2023에 accept된 'Key_Locked Rank One Editing for Text-to-Image Personalization'을 통해 100kB 크기에 약 4분 정도 학습을 하면 개인화된 이미지 생성 을 할 수 있는 모델 'Perfusion'을 공개하였습니다.

순수한 text로 부터 전체 image를 만드는 것이 아닌, concept를 지정하기 위한 예제 image를 몇개 입력 후 해당 concept를 포함하는 text를 입력하면 카타고리안에 들어가 있는  이미지를 생성하는 방식입니다.

코드는 곧 공개 예정이라고 합니다.
논문:https://research.nvidia.com/labs/par/Perfusion/

 

Key-Locked Rank One Editing for Text-to-Image Personalization

Text-to-image models (T2I) offer a new level of flexibility by allowing users to guide the creative process through natural language. However, personalizing these models to align with user-provided visual concepts remains a challenging problem. The task of

research.nvidia.com

Comparing Lock Types

Zero-shot Transfer To Fine-tuned Models

'IT New' 카테고리의 다른 글

MS 엑셀, 파이썬 지원...고급 데이터 분석 한번에  (0) 2023.08.28
인공지능 대화형 말벗 쳇봇  (0) 2023.08.11
GPT-4의 유출된 세부 정보  (0) 2023.07.16
Run Windows game on macOS  (0) 2023.06.09
Microsoft Build 2023  (0) 2023.05.25

댓글