MENU

Fun & Interesting

[Paper Review] DeepSeek, 이것만은 알고 가자!

Video Not Working? Fix It Now

발표자 : 천재원 석사과정([email protected]) 1. 세미나 제목: About DeepSeek : Only the Research, No Hype 2. 논문 링크: arxiv.org/html/2412.19437v1 / arxiv.org/abs/2501.12948 3. Overview: - Pretrained Language Model의 효율적인 학습 및 추론을 위한 여러 분야로부터 파생된 방법론들의 집대성이 DeepSeek-V3 Model을 탄생시킬 수 있었음 - 더 나아가, 좋은 성능의 PLM을 기반으로 RL-centric한 훈련 방식으로 SOTA 성능의 놀라운 추론 모델인 DeepSeek-R1 Model을 확보

Comment