본문 바로가기

AI137

OpenVoice https://github.com/myshell-ai/OpenVoice GitHub - myshell-ai/OpenVoice: Instant voice cloning by MyShell. Instant voice cloning by MyShell. Contribute to myshell-ai/OpenVoice development by creating an account on GitHub. github.com 2024. 1. 7.
Adaptive Shells for Efficient Neural Radiance Field Rendering NVIDIA 연구 논문에서는 '효율적인 신경 방사 필드 렌더링을 위한 적응형 셸(Adaptive Shells for Efficient Neural Radiance Field Rendering)'을 소개합니다. 이 기술은 체적 렌더링의 효율성과 표면 기반 접근 방식의 세부 사항 간의 균형을 맞추는 방법인 적응형 셸을 사용하여 3D 장면의 렌더링을 향상시킵니다. 이는 머리카락이나 가구와 같은 복잡한 텍스처를 실시간으로 렌더링하는 데 특히 유용합니다. 이 접근 방식은 렌더링 영역에 경계 메시를 사용하여 속도와 시각적 충실도를 모두 향상시킵니다. 이는 시뮬레이션과 애니메이션의 응용 분야에서 상당한 발전입니다. 자세한 내용은 여기에서 전체 문서를 읽을 수 있습니다. https://research.nvidia.co.. 2024. 1. 7.
GPS-Gaussian 논문 "GPS-Gaussian: 실시간 인간 신규 뷰 합성을 위한 일반화 가능한 픽셀별 3D 가우시안 스플래팅"은 실시간으로 캐릭터의 새로운 시점을 합성하는 새로운 방법을 제시합니다. 이는 소스 뷰에 정의된 가우시안 파라미터 맵을 도입하며, 직접적인 새로운 뷰 합성을 위해 가우시안 스플래팅 속성을 회귀합니다. 이 방법은 대량의 인간 스캔 데이터에서 가우시안 파라미터 회귀 모듈을 훈련시키며, 2D 파라미터 맵을 3D 공간으로 상승시키는 깊이 추정 모듈과 함께 작동합니다. 이 완전히 차별화된 프레임워크는 다양한 데이터셋에서 최신 방법들보다 우수한 성능과 속도를 보여줍니다. https://youtu.be/F4ePJtkRlgY 논문에선 16개의 카메라를 사용하여 구성하였습니다. https://github.com.. 2024. 1. 1.
Marigold Marigold: 단안 깊이 추정을 위한 확산 기반 이미지 생성기 용도 변경 작동 원리 미세 조정 프로토콜 사전 훈련된 Stable Diffusion에서 시작하여 이미지를 인코딩합니다.엑스그리고 깊이디원래의 Stable Diffusion VAE를 사용하여 잠재 공간에 삽입합니다. 우리는 깊이 잠재 코드와 관련하여 표준 확산 목표를 최적화하여 U-Net만 미세 조정합니다. 이미지 조절은 두 개의 잠재 코드를 U-Net에 공급하기 전에 연결하여 수행됩니다. U-Net의 첫 번째 레이어는 연결된 잠재 코드를 허용하도록 수정되었습니다. 프로젝트:https://marigoldmonodepth.github.io/ 논문:https://arxiv.org/abs/2312.02145 코랩:https://colab.rese.. 2023. 12. 25.