https://huggingface.co/datasets/maywell/ko_Ultrafeedback_binarized
허깅페이스 여러 모델 데이터셋들 구경 중..
OpenAI Dev Day 요약
https://openai.com/blog/new-models-and-developer-products-announced-at-devday
Intel의 Gaudi2
https://huggingface.co/Intel/neural-chat-7b-v3-1
Google에서 스리슬쩍 나온 새 모델
https://huggingface.co/google/switch-c-2048
마스크드 언어 모델링(MLM) 작업으로 학습된 전문가 혼합(MoE) 모델이다. 모델 아키텍처는 기존 T5와 유사하지만 feed forward layer가 "EXPERT" MLP를 포함하는 sparse MLP layer로 대체되었다. 파인튜닝 tasks에 기존 T5보다 좋다고 한다.
팔로우할만한 개발블로그들
OpenAI사 다니는 엄청난 분들이 운영하시는 개발블로그들..
https://lilianweng.github.io/posts/2023-03-15-prompt-engineering/
논문 실적들 보면 어마어마하다...후 이런 사람들이 open ai가는구낭 ㅇㅁㅇ...
(+) 요새 이슈
알트먼 이슈... Open AI 이러다가 Closed AI(?) 되나(!)
https://www.bbc.com/korean/articles/cw42l7pdy3eo
'TIL(Today I Learned)' 카테고리의 다른 글
TIL 231207 - 구글 Deepmind, Gemini 발표하다 (0) | 2023.12.07 |
---|---|
TIL 231124 - 잘 명령하기: 프롬프트 엔지니어링, LoRA: 비용 줄이기 (0) | 2023.11.24 |
TIL 231110 - Mistral 7B, OpenAI Dev day (0) | 2023.11.10 |
TIL - 231107 한국어 오픈소스 언어모델 LLM 탐구하기 (1) | 2023.11.07 |
TIL - 231031 (0) | 2023.10.31 |