본문 바로가기

분류 전체보기220

Gemini 1.5 pro health 비용이 문제만 해결된다면 새로운 시장이 열리고 있는 것이다. 나는 역기를 드는 것을 기록했다. 나는 비디오를 Gemini 1.5 Pro에 공급하고 각 운동의 이름, 세트 수, 반복 횟수, 무게에 대해 JSON을 작성하고 양식 비평을 생성하도록 요청했습니다. 완벽하게 작동했습니다. 카메라 + TTS에 연결하면 AI 개인 트레이너가 됩니다 https://twitter.com/mckaywrigley/status/1761113846520131816 X의 Mckay Wrigley님(@mckaywrigley) I recorded myself lifting weights. I fed the video into Gemini 1.5 Pro and asked it to write JSON for each exercise’.. 2024. 2. 25.
Fooocus https://colab.research.google.com/drive/1gyhYiNS7W5Oyvh1_sd0ZPeEk_9vEaqBc?usp=sharing Fooocus_devbrother.ipynb Colaboratory notebook colab.research.google.com https://stokemctoke.com/ Stoke McToke – Where AI, Art, and Learning Curve Converge I’ve always appreciated my website’s hero image, especially its cool, futuristic pyramids vibe. But, let’s be honest, it’s been the same view for too long, .. 2024. 2. 17.
시계열 예측모델 Lag-Llama: 확률적 시계열 예측을 위한 기초 모델을 향하여 Lag-Llama는 시계열 예측을 위한 최초의 오픈 소스 기반 모델 입니다 ! 트윗 스레드: https://twitter.com/arjunashok37/status/1755261111233114165 허깅페이스: https://huggingface.co/time-series-foundation-models/Lag-Llama Colab 데모: https://colab.research.google.com/drive/13HHKYL_HflHBKxDWycXgIUAHSeHRR5eo?usp=sharing GitHub: https://github.com/time-series-foundation-models/lag-llama 논문: https://time.. 2024. 2. 17.
TextToVideo SORA OpenAI OpenAI에서 텍스트로 비디오를 생성하는 AI모델을 만들어 냈습니다. 연구 기술 Sora는 정적인 노이즈처럼 보이는 비디오로 시작하여 여러 단계를 거쳐 노이즈를 제거하여 점차적으로 비디오를 변형시키는 확산 모델입니다. Sora는 전체 비디오를 한 번에 생성하거나 생성된 비디오를 확장하여 더 길게 만들 수 있습니다. 한 번에 여러 프레임에 대한 모델 예측을 제공함으로써 피사체가 일시적으로 시야에서 사라질 때에도 동일하게 유지되어야 하는 어려운 문제를 해결했습니다. GPT 모델과 유사하게 Sora는 변환기 아키텍처를 사용하여 뛰어난 확장 성능을 제공합니다. 우리는 비디오와 이미지를 패치라고 하는 더 작은 데이터 단위의 모음으로 표현하며, 각 패치는 GPT의 토큰과 유사합니다. 데이터를 표현하는 방법을 통합.. 2024. 2. 16.