DINOv2: 자체 감독 비전 변환기 모델
이미지 수준의 시각적 작업 (이미지 분류, 인스턴스 검색, 비디오 이해)과 픽셀 수준의 시각적 작업 (깊이 추정, 의미론적 분할) 에 적합한 범용 기능을 생성하는 기초 모델 제품군입니다 .
DINOv2 모델은 다양한 컴퓨터 비전 작업에서 선형 레이어만큼 간단한 분류기와 함께 직접 사용할 수 있는 고성능 시각적 기능을 생성합니다. 이러한 시각적 기능은 강력하며 미세 조정 요구 사항 없이 여러 도메인에서 잘 작동합니다. 모델은 라벨이나 주석을 사용하지 않고 142M 이미지 데이터 세트에서 사전 학습되었습니다.
모든 프레임의 패치 기능에 대한 세 가지 첫 번째 주요 구성 요소를 RGB 값에 매핑하여 시각화합니다.
- 데모 : https://dinov2.metademolab.com/
- 홈페이지 : https://dinov2.metademolab.com/
- 논문: https://arxiv.org/pdf/2304.07193.pdf
- 코드: https://github.com/facebookresearch/dinov2
'AI' 카테고리의 다른 글
Scrapegraph-ai (0) | 2024.05.12 |
---|---|
생성형AI정리 (0) | 2023.08.15 |
awesome 3d human reconstruction (0) | 2023.06.25 |
댓글