본문 바로가기
AI/STT, TTS

facebookresearch seamless_communication

by wenect 2024. 1. 8.

동시통역

Seamless는 언어 전반에 걸쳐 보다 자연스럽고 진정한 의사소통을 가능하게 하는 AI 모델 제품군입니다. SeamlessM4T는 약 100개 언어를 지원하는 대규모 다국어 다중 모드 기계 번역 모델입니다. SeamlessM4T는 여러 언어에 걸쳐 운율과 음성 스타일 요소를 보존하는 모델인 SeamlessExpressive와 약 100개 언어에 대한 동시 번역 및 스트리밍 ASR을 지원하는 모델인 SeamlessStreaming의 기반이 됩니다. SeamlessExpressive 및 SeamlessStreaming은 다국어, 실시간 및 표현력 있는 번역을 특징으로 하는 통합 모델인 Seamless로 결합됩니다.

SeamlessM4T 모델은 다음 작업을 지원합니다.

  • 음성-음성 번역(S2ST)
  • 음성-텍스트 번역(S2TT)
  • 문자를 음성으로 번역(T2ST)
  • 텍스트-텍스트 번역(T2TT)
  • 자동 음성 인식(ASR)

SeamlessStreaming 모델은 다음 작업을 지원합니다.

  • 음성-음성 번역(S2ST)
  • 음성-텍스트 번역(S2TT)
  • 자동 음성 인식(ASR)

SeamlessM4T 모델

모델명#params검문소측정항목

SeamlessM4T-대형 v2 2.3B 🤗 모델카드 - 체크포인트 측정항목
SeamlessM4T-대형(v1) 2.3B 🤗 모델카드 - 체크포인트 측정항목
SeamlessM4T-매체(v1) 1.2B 🤗 모델카드 - 체크포인트 측정항목

https://github.com/facebookresearch/seamless_communication

 

GitHub - facebookresearch/seamless_communication: Foundational Models for State-of-the-Art Speech and Text Translation

Foundational Models for State-of-the-Art Speech and Text Translation - GitHub - facebookresearch/seamless_communication: Foundational Models for State-of-the-Art Speech and Text Translation

github.com

'AI > STT, TTS' 카테고리의 다른 글

PaliGemma  (0) 2024.05.19
OpenVoice  (0) 2024.04.01
OpenVoice  (0) 2024.01.07
Distil-Whisper  (0) 2023.11.05
Whisper JAX  (2) 2023.05.01

댓글