DINOv2

DINOv2: 자체 감독 비전 변환기 모델
이미지 수준의 시각적 작업 (이미지 분류, 인스턴스 검색, 비디오 이해)과 픽셀 수준의 시각적 작업 (깊이 추정, 의미론적 분할) 에 적합한 범용 기능을 생성하는 기초 모델 제품군입니다 .

DINOv2 모델은 다양한 컴퓨터 비전 작업에서 선형 레이어만큼 간단한 분류기와 함께 직접 사용할 수 있는 고성능 시각적 기능을 생성합니다. 이러한 시각적 기능은 강력하며 미세 조정 요구 사항 없이 여러 도메인에서 잘 작동합니다. 모델은 라벨이나 주석을 사용하지 않고 142M 이미지 데이터 세트에서 사전 학습되었습니다.

모든 프레임의 패치 기능에 대한 세 가지 첫 번째 주요 구성 요소를 RGB 값에 매핑하여 시각화합니다.

데모 : https://dinov2.metademolab.com/
홈페이지 : https://dinov2.metademolab.com/
논문: https://arxiv.org/pdf/2304.07193.pdf
코드: https://github.com/facebookresearch/dinov2

저작자표시 (새창열림)

'AI' 카테고리의 다른 글

팔란티어의 AIPCon 7 컨퍼런스 (0)	2025.06.13
Anomalib (0)	2025.03.03
Scrapegraph-ai (0)	2024.05.12
생성형AI정리 (0)	2023.08.15
awesome 3d human reconstruction (0)	2023.06.25

개발의신

DINOv2

'AI' 카테고리의 다른 글

댓글

티스토리툴바

DINOv2

'AI' 카테고리의 다른 글

관련글

댓글

티스토리툴바