모든 이미지에 대해 고품질의 깊이 정보를 제공할 수 있는 단안 깊이 추정(Monocular Depth Estimation, MDE)을 위한 기반 모델 'Depth Anything'이 등장했습니다.
Depth Anything: 라벨이 지정되지 않은 대규모 데이터의 힘 발휘
Lihe Yang, Bingyi Kang, Zilong Huang, Xiaogang Xu, Jiashi Feng, Hengshuang Zhao
프로젝트 | 논문 | GitHub | 데모
기존의 방법과 달리 약 150만장의 라벨이 부착된 이미지와 함께 약 6200만장의 대규모 라벨이 없는 이미지를 이용하고 있습니다. 레이블이 없는 이미지를 효과적으로 활용하기 위해 연구팀은 자동으로 깊이 주석을 생성하는 데이터 엔진을 설계했습니다. 이를 통해 다양한 시나리오에 대응할 수 있는 풍부한 데이터 세트를 구축하고 모델의 일반화 능력을 높이는 것을 목표로 하고 있습니다.
또한, 의미적 세그멘테이션 태스크의 보조를 도입하는 것으로, MDE 모델의 성능 향상을 목표로 합니다. 이 접근법을 통해 MDE 모델은 높은 수준의 장면 이해 능력을 획득하고 중간 및 높은 수준의 인식 작업에 적합한 인코더 역할을 합니다.
실험 결과 Depth Anything 모델은 인상적인 일반화 능력을 보였다. 특히 다양한 유형의 데이터 세트에 대해 높은 정확도를 달성했으며 다양한 시나리오에서 효과를 입증했습니다. 또한 NYUv2 및 KITTI 데이터세트의 깊이 정보를 사용하여 수행된 미세 조정을 통해 새로운 최첨단 결과를 달성했습니다.
https://github.com/LiheYoung/Depth-Anything
참고: https://wenect.tistory.com/entry/SAM-SegmentAnything-meta
'AI > Segmentation' 카테고리의 다른 글
SAM, SAM2, SAMURAI 발표자료 (0) | 2024.12.10 |
---|---|
Grounded-Segment-Anything (0) | 2024.01.29 |
ZoeDepth: 상대적 깊이와 메트릭 깊이 결합 (공식 구현) (1) | 2024.01.24 |
EdgeSAM (0) | 2023.12.25 |
SAM (SegmentAnything)-meta (0) | 2023.12.25 |
댓글