91. 逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”

張小珺 Xiaojùn 1,147 2 days ago

Video Not Working? Fix It Now

2025年这个春节，DeepSeek一举改写了全球AGI大叙事。在万般热闹之际，我们特别想沉下来做一些基础科普工作。在《商业访谈录》89集节目中，我邀请了加州大学伯克利分校人工智能实验室在读博士生潘家怡，为大家对照解读了春节前的DeepSeek-R1-Zero、R1、Kimi发布的K1.5，以及OpenAI更早发布的o1技术报告。这些模型聚焦的都是大模型最新技术范式，RL强化学习，简单来说就是o1路线。今天这集，我邀请的是香港科技大学计算机系助理教授何俊贤。他的研究方向是大模型推理，从很早就开始关注DeepSeek的系列研究。我们会focus在最近引发全球AI届关注的DeepSeek上。何老师将带领大家从DeepSeek的第1篇论文开始，阅读经过挑选的这家公司历史上发布的9篇论文。我们希望帮助大家从一个更延续、更长期、也更技术底层的视角来理解DeepSeek，以及它所做的复现与创新工作；与此同时也希望能让更多人感受到技术之美。（如果如果，你觉得光听还不够刺激，觉得一定要坐在电脑前看着投屏、拿起纸笔学习更有沉浸感…如果你实在是真心想要找虐的话…请前往：含投屏的视频版本 (https://www.bilibili.com/video/BV1xuK5eREJi/?vd_source=aa7c66a3d015be4b5bfcd520784f2790) 。嘿嘿！预祝你学习顺利啦！2025我们和AI共同进步！）我们的播客节目在腾讯新闻首发 (https://view.inews.qq.com/u/8QIf3n5c64Ucuzne7gI%3D?devid=FF4E49E6-9C89-4986-A413-04E856F31262&qimei=766696f2cd8f313d744bc2c9000012918102&uid=100161026780) ，大家可以前往关注哦，这样可以第一时间获取节目信息和更多新闻资讯：）03:01 讲解开始前，先提问几个小问题整体风格：Open、Honest、低调、严谨的科学态度 DeepSeek基座模型 21:00 《DeepSeek LLM Scaling Open-Source Language Models with Longtermism》技术讲解 45:48 《DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models》技术讲解 01:06:40 《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》技术讲解 01:40:17 《DeepSeek-V3 Technical Report》技术讲解 DeepSeek推理模型 02:05:03 《DeepSeek-Coder: When the Large Language Model Meets Programming - The Rise of Code Intelligence》技术讲解 02:12:16 《DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence》技术讲解 02:47:18 《DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data》和《DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search》技术讲解 02:52:40 《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》技术讲解 03:01:41 9篇论文到这里都讲完啦！最后我们一起强化学习一下！关于强化学习往期节目： AGI范式大转移：和广密预言草莓、OpenAI o1和self-play RL｜全球大模型季报4 (https://www.xiaoyuzhoufm.com/episodes/66d866f0f39a2201c069dccb) 和OpenAI前研究员吴翼解读o1：吹响了开挖第二座金矿的号角 (https://www.xiaoyuzhoufm.com/episodes/66eaac153a5ff0a0ca3c9a93) 王小川返场谈o1与强化学习：摸到了一条从快思考走向慢思考的路 (https://www.xiaoyuzhoufm.com/episodes/66f3763a2adfe48b833eff31) 逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净” (https://www.xiaoyuzhoufm.com/episodes/67a1b697247d51713c868367) 开源一场关于DeepSeek的高质量闭门会：一场关于DeepSeek的高质量闭门会：“比技术更重要的是愿景” (https://mp.weixin.qq.com/s/cXafYIotJUGUmWasXrJvcw) 【更多信息】联络我们：微博@张小珺-Benita (https://weibo.com/u/6486678714) ，小红书@张小珺 (https://www.xiaohongshu.com/user/profile/5fede947000000000100603e?xhsshare=CopyLink&appuid=5fede947000000000100603e&apptime=1710049463) 更多信息欢迎关注公众号：张小珺

Comment