본문 바로가기

분류 전체보기250

sesame.com 사람과 같은 대화 수준 https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice#demo Crossing the uncanny valley of conversational voiceAt Sesame, our goal is to achieve “voice presence”—the magical quality that makes spoken interactions feel real, understood, and valued.www.sesame.com이 저장소는 단어 수준 타임스탬프와 화자 일기 기능을 사용해 빠른 자동 음성 인식(대형 v2에서 70배 실시간) 기능을 제공합니다.⚡️ whisper large-v2를 사용하여 70배 실시간 전사를 위한 일괄 추론🪶 f.. 2025. 3. 10.
Anomalib 아래는 Anomalib에 대한 전체적인 개요와 핵심 기술, 지원하는 모델 목록, 그리고 가상환경을 이용한 설치 방법에 대한 자세한 설명입니다.Anomalib 개요Anomalib는 OpenVINO Toolkit 팀에서 개발한 오픈소스 이상 탐지(Anomaly Detection) 프레임워크입니다. 이 라이브러리는 다양한 최신 이상 탐지 알고리즘들을 통합하여, 사용자들이 손쉽게 모델을 학습, 평가, 그리고 배포할 수 있도록 설계되었습니다. Anomalib는 컴퓨터 비전 분야에서 정상과 비정상(이상) 데이터를 구분하고, 이상 위치를 효과적으로 탐지하기 위한 모듈식 설계를 특징으로 합니다.핵심 기술 설명특징 추출 (Feature Extraction) 및 표현 학습딥러닝 백본(Backbone) 활용: ResNet,.. 2025. 3. 3.
YOLO12 설명, 11 vs 12 비교 YOLO11과 YOLO12의 주요 차이점을 요약한 비교YOLO11 vs YOLO12모델 구조개선된 백본 및 넥 아키텍처를 사용하여 적은 파라미터로 빠른 추론을 실현함전통적인 CNN 방식에서 벗어나 영역 주의 메커니즘과 R-ELAN, 플래시어텐션을 도입하여 정밀도를 높임특징 추출효율적 파라미터 사용과 최적화된 특징 추출로 실시간 성능을 극대화함R-ELAN 및 영역 주의 메커니즘을 통해 중요한 부분에 집중, 불필요한 연산을 줄여 정밀한 객체 감지 성능을 제공함주의 메커니즘기존의 방식 사용이미지의 중요한 영역에 집중하는 영역 기반 주의 메커니즘 도입, 선택적으로 플래시어텐션 활용 가능속도최적화된 트레이닝 파이프라인과 구조로 매우 빠른 추론 속도를 보임정밀도 향상을 위해 약간의 속도 저하(예: YOLO12m은 .. 2025. 3. 3.
Meta 스마트 안경 Project Aria Gen 2 출시 Meta의 블로그 글은 Meta Reality Labs에서 진행 중인 차세대 이고센트릭(자기 중심) 연구 안경인 Project Aria Gen 2에 대해 소개합니다. 이 글에서 다루는 주요 내용은 다음과 같습니다:프로젝트 개요Project Aria Gen 2는 기존 Project Aria의 후속 버전으로, 인공지능(AI), 컴퓨터 비전, 로보틱스, 증강현실(AR) 등 다양한 분야의 연구를 지원하기 위해 개발된 연구용 안경입니다. 이 안경은 사용자의 시점을 중심으로 데이터를 수집하여, 현실 세계의 다양한 상황에서 AI와 관련 기술의 성능을 향상시키는 데 활용됩니다.기술 및 기능 향상센서 및 하드웨어 개선: 차세대 모델은 향상된 센서와 카메라 시스템, 더 빠른 프로세서 및 최적화된 하드웨어를 탑재하여 이전 .. 2025. 2. 28.