한국어 오픈소스 대화 모델
고려대 KULLM 구름
https://github.com/nlpai-lab/KULLM
KoAlpaca
https://github.com/Beomi/KoAlpaca
테스크마다 다르지만 구름은 말이 좀 길고 코알파카는 짧은 편이라고 한다
https://huggingface.co/TheBloke/Llama-2-70B-GPTQ
라마2 70B GPTQ버전이 가장 낫다는 평이 많다
https://huggingface.co/garage-bAInd/Platypus2-70B-instruct
instruct tuning되는 버전
그 밖에 한국어 오픈소스 모델들
https://github.com/NomaDamas/awesome-korean-llm
https://enterprise.kt.com/pd/P_PD_NE_00_316.do
KT에서 공개한 '믿음'
이름부터 믿음이 간다(?)
I'm 믿음이에요...........
https://huggingface.co/KT-AI/midm-bitext-S-7B-inst-v1
7B 버전
AI-HUB(https://www.aihub.or.kr/) 의 말뭉치 데이터와 국립국어원 모두의 말뭉치 데이터 (https://corpus.korean.go.kr/) 를 사전 학습 단계에서 이용하였다고 한다.
이번엔 이미지 + 텍스트 멀티모달 모델들을 탐구해봅시댜
LLM에 이미지+텍스트 넣는 대표모델은 Llava, Kollava, Qwen, Fuyu 등이 있다.
https://huggingface.co/spaces/etri-vilab/Ko-LLaVA
'TIL(Today I Learned)' 카테고리의 다른 글
TIL 231123 OpenAI 세상 구경하기 (1) | 2023.11.23 |
---|---|
TIL 231110 - Mistral 7B, OpenAI Dev day (0) | 2023.11.10 |
TIL - 231031 (0) | 2023.10.31 |
TIL - 231027 (0) | 2023.10.27 |
TIL - 231025 (0) | 2023.10.25 |