본문 바로가기

분류 전체보기245

facebookresearch seamless_communication 동시통역 Seamless는 언어 전반에 걸쳐 보다 자연스럽고 진정한 의사소통을 가능하게 하는 AI 모델 제품군입니다. SeamlessM4T는 약 100개 언어를 지원하는 대규모 다국어 다중 모드 기계 번역 모델입니다. SeamlessM4T는 여러 언어에 걸쳐 운율과 음성 스타일 요소를 보존하는 모델인 SeamlessExpressive와 약 100개 언어에 대한 동시 번역 및 스트리밍 ASR을 지원하는 모델인 SeamlessStreaming의 기반이 됩니다. SeamlessExpressive 및 SeamlessStreaming은 다국어, 실시간 및 표현력 있는 번역을 특징으로 하는 통합 모델인 Seamless로 결합됩니다. SeamlessM4T 모델은 다음 작업을 지원합니다. 음성-음성 번역(S2ST) 음.. 2024. 1. 8.
Microsoft-Phi-2-Streamlit 모바일에서 돌릴수 있는 ChatGPT3.5 수준 https://github.com/shrimantasatpati/Microsoft-Phi-2-Streamlit GitHub - shrimantasatpati/Microsoft-Phi-2-Streamlit: Microsoft Phi 2 Streamlit App, deployed on HuggingFace Spaces is based on t Microsoft Phi 2 Streamlit App, deployed on HuggingFace Spaces is based on the Microsoft Phi 2 small language model (SLM) for text generation. - GitHub - shrimantasatpati/Microsoft-.. 2024. 1. 7.
OpenVoice https://github.com/myshell-ai/OpenVoice GitHub - myshell-ai/OpenVoice: Instant voice cloning by MyShell. Instant voice cloning by MyShell. Contribute to myshell-ai/OpenVoice development by creating an account on GitHub. github.com 2024. 1. 7.
Adaptive Shells for Efficient Neural Radiance Field Rendering NVIDIA 연구 논문에서는 '효율적인 신경 방사 필드 렌더링을 위한 적응형 셸(Adaptive Shells for Efficient Neural Radiance Field Rendering)'을 소개합니다. 이 기술은 체적 렌더링의 효율성과 표면 기반 접근 방식의 세부 사항 간의 균형을 맞추는 방법인 적응형 셸을 사용하여 3D 장면의 렌더링을 향상시킵니다. 이는 머리카락이나 가구와 같은 복잡한 텍스처를 실시간으로 렌더링하는 데 특히 유용합니다. 이 접근 방식은 렌더링 영역에 경계 메시를 사용하여 속도와 시각적 충실도를 모두 향상시킵니다. 이는 시뮬레이션과 애니메이션의 응용 분야에서 상당한 발전입니다. 자세한 내용은 여기에서 전체 문서를 읽을 수 있습니다. https://research.nvidia.co.. 2024. 1. 7.