본문 바로가기

AI139

Whisper instllation on Whisper는 범용 음성 인식 모델입니다. 다양한 오디오의 대규모 데이터 세트에 대해 학습되며 다국어 음성 인식, 음성 번역 및 언어 식별을 수행할 수 있는 멀티태스킹 모델이기도 합니다. Whisper API는 2023년 3월에 출시된 오픈AI의 새로운 서비스입니다. 이 API를 사용하면 음성을 텍스트로 변환하는 기능을 앱이나 제품에 쉽게 통합할 수 있습니다. 다만, API 사용은 유료이며, 텍스트로 변환하려는 음성 파일의 길이(분당 $0.006(약 8원))에 따라 과금됩니다. API 사용요금 Model: Whisper Usage: $0.006 / minute (rounded to the nearest second) 여기서는 Github에 있는 무료 버전을 사용해서 Ubuntu 20.04에 설치할 것입.. 2023. 3. 30.
Alphaca Alpaca는 LLaMA 언어모델을 Stanford 사용자의 명령어에 언어모델이 잘 답변할 수 있도록 Instruction-following 데이터로 파인튜닝한 모델입니다. 스탠포드 알파카(Stanford Alpaca)는 스탠포드 대학교 연구팀이 개발한 자연어 처리(NLP) 기술을 기반으로 하는 AI 프로그램입니다. 알파카는 대화를 이끌어 나가는 인공지능 기술로, 자연어 처리를 통해 사용자와 의미있는 대화를 나눌 수 있습니다. 이 프로젝트의 목표는 인공지능이 사람처럼 대화를 이해하고, 자연스럽게 응답할 수 있는 능력을 개발하는 것입니다. 스탠포드 알파카는 다양한 분야의 정보를 학습하고, 이를 바탕으로 사용자의 질문에 정확하고 신속하게 답변할 수 있도록 설계되었습니다. 기계 학습, 딥 러닝, 자연어 처리,.. 2023. 3. 30.
Upscaling 3 Tools 비디오 또는 이미지 고해상도로 변환 비디오 이미지 1.Vidmore 비디오 변환기-빠른 속도로 비디오를 모든 형식으로 변환 -무료 비디오 변환기 Vidmore Video Converter는 비디오를 300개 이상의 형식으로 변환하는 최고의 비디오 처리 소프트웨어입니다. 비디오 변환은 품질 손실 없이 초고속입니다. www.vidmore.com 2. Adobe Premiere Pro로 비디오 업 스케일링 -유료 3. Handbrake - 핸드 브레이크로 비디오 해상도 높이기 -무료 HandBrake: Open Source Video Transcoder HandBrake: Open Source Video Transcoder HandBrake is a open-source tool, built by volunt.. 2023. 3. 28.
Visual chatGPT 비주얼 챗GPT Visual ChatGPT는 ChatGPT와 일련의 Visual Foundation Models를 연결하여 채팅 중에 이미지를 보내고 받을 수 있도록 합니다. 코랩으로 복사해서 돌려볼수 있습니다. https://colab.research.google.com/drive/11BtP3h-w0dZjA-X8JsS9_eo8OeGYvxXB VisualChatGPT Colaboratory notebook colab.research.google.com https://github.com/microsoft/visual-chatgpt GitHub - microsoft/visual-chatgpt: Official repo for the paper: Visual ChatGPT: Talking, Drawing an.. 2023. 3. 24.