본문 바로가기
AI/YOLO

YOLO12 설명, 11 vs 12 비교

by wenect 2025. 3. 3.

YOLO11과 YOLO12의 주요 차이점을 요약한 비교

YOLO11 vs YOLO12

모델 구조 개선된 백본 및 넥 아키텍처를 사용하여 적은 파라미터로 빠른 추론을 실현함 전통적인 CNN 방식에서 벗어나 영역 주의 메커니즘과 R-ELAN, 플래시어텐션을 도입하여 정밀도를 높임
특징 추출 효율적 파라미터 사용과 최적화된 특징 추출로 실시간 성능을 극대화함 R-ELAN 및 영역 주의 메커니즘을 통해 중요한 부분에 집중, 불필요한 연산을 줄여 정밀한 객체 감지 성능을 제공함
주의 메커니즘 기존의 방식 사용 이미지의 중요한 영역에 집중하는 영역 기반 주의 메커니즘 도입, 선택적으로 플래시어텐션 활용 가능
속도 최적화된 트레이닝 파이프라인과 구조로 매우 빠른 추론 속도를 보임 정밀도 향상을 위해 약간의 속도 저하(예: YOLO12m은 YOLO11m 대비 약 3% 느림)가 있으나, 실시간 처리 성능은 유지함
정확도 효율적 구조로 우수한 실시간 성능 제공 COCO 데이터셋 기준 mAP에서 YOLOv10/YOLO11 대비 개선(예: YOLO12n은 +2.1% mAP, YOLO12m은 +1.0% mAP 향상)을 달성함
지원 작업 물체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정, OBB 등 다양한 작업 지원 YOLO11과 동일한 작업 지원 외, 주의 메커니즘으로 추가 최적화를 통해 더욱 정밀한 감지 성능 제공
배포 및 활용 엣지 디바이스, 클라우드 등 다양한 환경에서 배포 가능 유연한 배포가 가능하며, 플래시어텐션을 활용할 경우 메모리 효율 및 처리 속도 최적화에 도움을 줌

결론:
실시간 응답이 중요한 애플리케이션이라면 YOLO11이 유리할 수 있고, 정밀도가 더 중요한 애플리케이션에서는 YOLO12를 선택하는 것이 좋습니다.

참고 자료:

https://docs.ultralytics.com/ko/models/yolo12/

 

YOLO12

타의 추종을 불허하는 정확성과 효율성으로 최첨단 물체 감지를 위한 획기적인 주의 집중 아키텍처를 갖춘 YOLO12를 만나보세요.

docs.ultralytics.com

 

YOLO11의 특징

  • 향상된 특징 추출 및 효율성:
    YOLO11은 개선된 백본과 넥 아키텍처를 도입하여 적은 수의 파라미터로 높은 정확도를 달성합니다. 이로 인해 모델은 빠른 추론 속도를 유지하면서도 다양한 환경(엣지 디바이스, 클라우드 등)에 쉽게 배포할 수 있습니다.
  • docs.ultralytics.com
  • 다양한 작업 지원:
    물체 감지, 인스턴스 분할, 이미지 분류, 포즈 추정, OBB 등 다양한 컴퓨터 비전 작업에 최적화되어 있습니다.
  • 실시간 성능 최적화:
    최적화된 트레이닝 파이프라인과 효율적인 네트워크 구조 덕분에 빠른 실시간 처리 속도를 제공합니다.

YOLO12의 특징

  • 주의 집중(Attention) 메커니즘 도입:
    YOLO12는 기존 CNN 기반 접근 방식에서 벗어나, 영역 기반 주의 메커니즘을 도입하여 이미지의 중요한 부분에 집중합니다. 이로 인해 불필요한 연산을 줄이고, 더 정밀한 객체 감지를 실현합니다.
  • docs.ultralytics.com
  • 잔여 효율적 레이어 집계 네트워크(R-ELAN) 및 플래시어텐션:
    R-ELAN 모듈을 통해 피처 집계 방식을 개선하고, 선택적으로 플래시어텐션을 컴파일하여 메모리 효율성을 높일 수 있습니다.
  • docs.ultralytics.com
  • 정확도와 속도의 균형:
    성능 벤치마크에서는 YOLO12n의 경우, COCO val2017 데이터셋에서 YOLOv10n 대비 +2.1% mAP 향상, YOLO11n보다도 개선된 수치를 보입니다. 다만, 높은 정밀도를 달성하기 위해 일부 모델은 YOLO11보다 약간 느린 추론 속도를 보입니다(예: YOLO12m는 YOLO11m 대비 약 3% 느림).
  • docs.ultralytics.com

어떤 모델을 선택해야 할까?

  • 실시간 처리와 속도가 중요한 경우:
    만약 애플리케이션이 실시간 처리가 핵심이라면, YOLO11의 빠른 추론 속도와 최적화된 효율성이 유리할 수 있습니다.

정밀도가 더 중요한 경우:
높은 정확도와 정밀한 객체 감지가 필요하다면, 이미지 내 중요 영역에 집중하는 YOLO12가 더 나은 선택입니다. 다만, 약간의 속도 저하를 감수해야 할 수 있습니다.

 

R-ELAN (Residual Efficient Layer Aggregation Network) 모델의 설명을 높이기 위해 설계된 개선된 기능 집계 모듈

기존 개념 : 기존의 ELan(효과적인 레이어 집계 네트웍) 고조를 기잔으로 하면서 , 잔여 연결을 추가하여 피처의 전달과 집계를 보다 효율적으로 수행, 잔여 연결은 딥러닝 네트워크에서 학습이 어려워지는 문제를 완화하고 더 깊은 네트워크에서도 안정적으로 학습을 가능하게 합니다.

주요특징:

  • 스케일링이 있는 블록 수전의 잔여 연결:
  • 블록 단위로 잔여 연결을 도입하여 네트워크가 다양한 크기의 피처 맵을 효과적으로 결합할수 있도록 합니다.
  • 병목 현상 완화: 기존 구조에서 발생할 수 있는 병목 현상을 재설계하여 피처 집계가 원활하게 이루어 지도록 개선합니다.
  • 효율적인 피처 집계: 여러계층의 피처를 통합하면서 중요한 정보는 강조하고 불필요한 연산은 줄여 전체 모델의 효율성과 정확도를 를 향상 시킵니다.

 

모델의 역할:

R-ELAN은 특히 YOLO12와 같이 어텐션 메커니즘을 사용하는 모델에서 핵심적인 역할을 합니다. 네트웍의 다양한 계층에서 추출된 피처를 효과적으로 통합하여 최종적으로 개체 감지의 정밀도를 높이고 학습을 안정화하는데 기여합니다.

 

 

'AI > YOLO' 카테고리의 다른 글

CycleGAN을 이용한 데이터 증강  (0) 2024.07.08
YOLOv8  (0) 2024.05.21
YOLOv8-오탐률(False Positive Rate) 낮추기  (0) 2024.05.21

댓글