https://huggingface.co/datasets/maywell/ko_Ultrafeedback_binarized
허깅페이스 여러 모델 데이터셋들 구경 중..
maywell/ko_Ultrafeedback_binarized · Datasets at Hugging Face
대기 컨베이션은 지구의 날씨와 기후 시스템에서 중요한 과정입니다. 이는 열과 수분이 대기에서 수직으로 이동하는 중심 메커니즘으로, 구름과 강수의 형성부터 격렬한 천둥 번개와 허리케인
huggingface.co
OpenAI Dev Day 요약
https://openai.com/blog/new-models-and-developer-products-announced-at-devday
New models and developer products announced at DevDay
GPT-4 Turbo with 128K context and lower prices, the new Assistants API, GPT-4 Turbo with Vision, DALL·E 3 API, and more.
openai.com
Intel의 Gaudi2
https://huggingface.co/Intel/neural-chat-7b-v3-1
Intel/neural-chat-7b-v3-1 · Hugging Face
Fine-tuning on Habana Gaudi2 This model is a fine-tuned model based on mistralai/Mistral-7B-v0.1 on the open source dataset Open-Orca/SlimOrca. Then we align it with DPO algorithm. For more details, you can refer our blog: The Practice of Supervised Fine-t
huggingface.co
Supervised Fine-Tuning and Direct Preference Optimization on Intel Gaudi2
Demonstrating a Top-Ranked 7B Chat Model on the LLM Leaderboard
medium.com
Google에서 스리슬쩍 나온 새 모델
https://huggingface.co/google/switch-c-2048
google/switch-c-2048 · Hugging Face
Inference API has been turned off for this model.
huggingface.co
마스크드 언어 모델링(MLM) 작업으로 학습된 전문가 혼합(MoE) 모델이다. 모델 아키텍처는 기존 T5와 유사하지만 feed forward layer가 "EXPERT" MLP를 포함하는 sparse MLP layer로 대체되었다. 파인튜닝 tasks에 기존 T5보다 좋다고 한다.
팔로우할만한 개발블로그들
OpenAI사 다니는 엄청난 분들이 운영하시는 개발블로그들..
https://lilianweng.github.io/posts/2023-03-15-prompt-engineering/
Prompt Engineering
Prompt Engineering, also known as In-Context Prompting, refers to methods for how to communicate with LLM to steer its behavior for desired outcomes without updating the model weights. It is an empirical science and the effect of prompt engineering methods
lilianweng.github.io
🤯Cameron Raymond🤯
Automated vs. manual case investigation and contact tracing for pandemic surveillance Nov. 2022 Lead author on the first randomized control trial of COVID-19 contact tracing – accepted to The Lancet's subsidiary, eClinicalMedicine.
cameronraymond.me
Yang Song
Generating realistic data with complex patterns, such as images, audio, or molecular structures, often relies on expressive probabilistic models to represent and estimate high- dimensional data distributions. However, even with the power of deep neural net
yang-song.net
논문 실적들 보면 어마어마하다...후 이런 사람들이 open ai가는구낭 ㅇㅁㅇ...
(+) 요새 이슈
알트먼 이슈... Open AI 이러다가 Closed AI(?) 되나(!)
https://www.bbc.com/korean/articles/cw42l7pdy3eo
샘 알트먼 CEO 해임…도대체 오픈AI에선 무슨 일이 벌어지고 있나? - BBC News 코리아
‘챗GPT’를 출시해 전 세계의 이목을 집중시킨 ‘오픈AI’사의 공동 창업자이자 CEO인 샘 알트먼이 이사회에 의해 갑자기 해고된 후 마이크로소프트(MS)에 합류하게 됐다.
www.bbc.com
'TIL(Today I Learned)' 카테고리의 다른 글
TIL 231207 - 구글 Deepmind, Gemini 발표하다 (0) | 2023.12.07 |
---|---|
TIL 231124 - 잘 명령하기: 프롬프트 엔지니어링, LoRA: 비용 줄이기 (0) | 2023.11.24 |
TIL 231110 - Mistral 7B, OpenAI Dev day (0) | 2023.11.10 |
TIL - 231107 한국어 오픈소스 언어모델 LLM 탐구하기 (1) | 2023.11.07 |
TIL - 231031 (0) | 2023.10.31 |