TIL(Today I Learned)

TIL 231123 OpenAI 세상 구경하기

https://huggingface.co/datasets/maywell/ko_Ultrafeedback_binarized

허깅페이스 여러 모델 데이터셋들 구경 중..

 

maywell/ko_Ultrafeedback_binarized · Datasets at Hugging Face

대기 컨베이션은 지구의 날씨와 기후 시스템에서 중요한 과정입니다. 이는 열과 수분이 대기에서 수직으로 이동하는 중심 메커니즘으로, 구름과 강수의 형성부터 격렬한 천둥 번개와 허리케인

huggingface.co

 

 

 

OpenAI Dev Day 요약

https://openai.com/blog/new-models-and-developer-products-announced-at-devday

 

New models and developer products announced at DevDay

GPT-4 Turbo with 128K context and lower prices, the new Assistants API, GPT-4 Turbo with Vision, DALL·E 3 API, and more.

openai.com

 

 

 

Intel의 Gaudi2

https://huggingface.co/Intel/neural-chat-7b-v3-1

 

Intel/neural-chat-7b-v3-1 · Hugging Face

Fine-tuning on Habana Gaudi2 This model is a fine-tuned model based on mistralai/Mistral-7B-v0.1 on the open source dataset Open-Orca/SlimOrca. Then we align it with DPO algorithm. For more details, you can refer our blog: The Practice of Supervised Fine-t

huggingface.co

https://medium.com/intel-analytics-software/the-practice-of-supervised-finetuning-and-direct-preference-optimization-on-habana-gaudi2-a1197d8a3cd3

 

Supervised Fine-Tuning and Direct Preference Optimization on Intel Gaudi2

Demonstrating a Top-Ranked 7B Chat Model on the LLM Leaderboard

medium.com

 

 

Google에서 스리슬쩍 나온 새 모델

https://huggingface.co/google/switch-c-2048

 

google/switch-c-2048 · Hugging Face

Inference API has been turned off for this model.

huggingface.co

마스크드 언어 모델링(MLM) 작업으로 학습된 전문가 혼합(MoE) 모델이다. 모델 아키텍처는 기존 T5와 유사하지만 feed forward layer가 "EXPERT" MLP를 포함하는 sparse MLP layer로 대체되었다. 파인튜닝 tasks에 기존 T5보다 좋다고 한다.

 

 

팔로우할만한 개발블로그들

 

OpenAI사 다니는 엄청난 분들이 운영하시는 개발블로그들..

https://lilianweng.github.io/posts/2023-03-15-prompt-engineering/ 

 

Prompt Engineering

Prompt Engineering, also known as In-Context Prompting, refers to methods for how to communicate with LLM to steer its behavior for desired outcomes without updating the model weights. It is an empirical science and the effect of prompt engineering methods

lilianweng.github.io

https://cameronraymond.me/

 

🤯Cameron Raymond🤯

Automated vs. manual case investigation and contact tracing for pandemic surveillance Nov. 2022 Lead author on the first randomized control trial of COVID-19 contact tracing – accepted to The Lancet's subsidiary, eClinicalMedicine.

cameronraymond.me

https://yang-song.net/

 

Yang Song

Generating realistic data with complex patterns, such as images, audio, or molecular structures, often relies on expressive probabilistic models to represent and estimate high- dimensional data distributions. However, even with the power of deep neural net

yang-song.net

 

 

논문 실적들 보면 어마어마하다...후 이런 사람들이 open ai가는구낭 ㅇㅁㅇ...

 

 

 

 

(+) 요새 이슈 

알트먼 이슈... Open AI 이러다가 Closed AI(?) 되나(!)

https://www.bbc.com/korean/articles/cw42l7pdy3eo

 

샘 알트먼 CEO 해임…도대체 오픈AI에선 무슨 일이 벌어지고 있나? - BBC News 코리아

‘챗GPT’를 출시해 전 세계의 이목을 집중시킨 ‘오픈AI’사의 공동 창업자이자 CEO인 샘 알트먼이 이사회에 의해 갑자기 해고된 후 마이크로소프트(MS)에 합류하게 됐다.

www.bbc.com