본문 바로가기

AI/LLaMA, Alpaca, Vicuna

Vicuna

by wenect 2023. 4. 16.

Vicuna : llama를 사용자 대화로 파인튜닝한 오픈 소스 챗봇

라마를 파인튜닝한 13B 모델.
ShareGPT의 70K 공개된 데이터로 학습함.
GPT-3로 평가했을 때 ChatGPT, Bard의 90% 성능을 달성함.
Vicuna-13B를 트레이닝할 때 300달러가 들어감.
트레이닝 코드와 실행 코드를 공개함. : GitHub - lm-sys/FastChat: The release repo for "Vicuna: An Open Chatbot Impressing GPT-4"
비쿠냐 온라인 데모 : FastChat

Gradio

Build & Share Delightful Machine Learning Apps

gradio.app

GPU로 돌리면 28GB (경량화 시 18GB) 정도가 필요하다.
CPU로 돌리면 60GB의 CPU 메모리가 필요하다고 한다.
훈련을 시킬 때는 80GB A100 8대로 가능하다고 한다.
llama를 chatgpt의 사용자 대화로 파인튜닝한 모델인 셈이다.

저작자표시 (새창열림)

'AI > LLaMA, Alpaca, Vicuna' 카테고리의 다른 글

GPT4All (1)	2023.04.02
ChatDoctor (1)	2023.04.01
Alphaca (4)	2023.03.30
메타 : 대규모 언어 모델(LLM)을 공개 (0)	2023.03.08

댓글

티스토리툴바