组织机构: DeepSeek, Open AI, Google, 信通院, 世纪坛医院, 华佗GPT团队, 阿里, 百度, 英伟达. 清华
技术: 强化学习 (RL), 自主数据生成 (DataGen), 深度推理能力 (COT), 模型架构优化 (ModelArch), 预训练 (Pretraining), 后训练 (Post-training), 推理时计算 (Test-timing computer), 蒸馏, SFT, Agent, RAG, Deep Search, COT, Function Calling, MoE, Transformer, GAN, VAE, 910B, H100, A100.
模型: DeepSeek-V2, DeepSeek-Coder, DeepSeek-Math, GPT-3.5, LaMDA, 千问, 华佗GPT, cosmos.
任务: 代码生成,数学推理,文本生成,问答,逻辑推理.
指标: 性能, 效率, 可解释性, 速度, 成本, 多样性, 质量, 准确率, 一致性, 训练时间, 算力需求.
领域/行业: 金融,医疗,法律,教育,矿业,搜索,自动驾驶,机器人,工业.
起点/基础: 高质量的数据是训练高性能模型的基础。DataGen 提供了一种新的、可能更有效的数据获取方式。
直接影响: DataGen 的变化(速度、成本、多样性、质量)会直接影响模型性能 (K1) 和训练效率 (K3)。
核心: DeepSeek 的突破主要在于其 DataGen 技术,这被认为是“大模型迎来第二春”的关键(循证:00:02:10)。
强化学习、自主数据生成和深度推理能力是提升大模型性能的关键技术。
自主数据生成正在改变数据获取方式,降低成本并提高效率。
算力需求呈现分化趋势,训练成本降低,推理成本增加。
垂直模型在特定行业具有巨大潜力,行业知识和商业化能力至关重要。
RAG/Agent 与 COT 的结合将推动智能系统向更高级别发展。
具身智能是未来发展方向,仿真数据和世界模型是关键。
模型的可解释性在特定行业(如律师, 医疗)至关重要.
大模型 --(性能)--> 提升
强化学习 --(作用于)--> 大模型
自主数据生成 --(生成)--> 数据 --(用于)--> 大模型训练
深度推理 --(作用于)--> RAG/Agent --(提升)--> 大模型智能
大模型 --(需求)--> 算力
训练算力 --(变化)--> 降低
推理算力 --(变化)--> 增加
算力租赁 --(成为)--> 趋势
大模型 --(应用于)--> 行业
垂直模型 --(需要)--> 行业知识 & 商业化能力
大模型 --(面临)--> 风险
数据安全 & 隐私 --(需要)--> 监管 & 技术保障
模型偏见 --(需要)--> 检测 & 缓解
鲁棒性 & 泛化能力 --(需要)--> 数据平衡 & 算法优化
技术伦理 -- (需要)-->伦理规范和监管机制
大模型 --(需求)-->可解释性
垂直模型 --(需要)--> 可解释性 (为决策提供依据)
RAG/Agent -- (结合COT) --> 可解释性
技术层面:Post-training 和 Test-timing computation 阶段的性能提升。
算力层面:推理算力需求激增,训练算力需求线性增长,算力格局转变。
模型层面:垂直模型公司爆发,通用模型公司走向强化学习。
应用层面:定制化公司面临挑战,RAG 和 Agent 框架需要结合推理能力。
报告目录:
引言:DEPSC 的出现及其意义
DEPSC 的技术创新:
2.1 强化学习在 Post-training 阶段的应用
2.2 自主生成数据:减少对蒸馏数据和人类标注数据的依赖
2.3 深度思考能力(COT)
DEPSC 对大模型行业的影响:
3.1 算力需求:
3.1.1 推理算力需求指数级增长
3.1.2 训练算力需求线性增长
3.1.3 算力格局转变:推理为主,训练为辅
3.1.4 国产算力的发展
3.2 模型格局:
3.2.1 垂直模型公司爆发
3.2.2 通用模型公司走向强化学习
3.2.3 垂直模型公司竞争的五个象限:行业 Know-how、商务能力、专业训练团队、算力、专业数据获取能力
3.3 应用场景:
3.3.1 定制化公司面临挑战与转型
3.3.2 RAG 和 Agent 框架结合 COT,实现能力跃升
2025 年 AI 发展趋势展望:
4.1 世界模型(物理模型)的兴起
4.2 仿真数据在自动驾驶、工业、机器人领域的应用
4.3 空间智能技术架构:AI 链接推理、边缘设备和仿真
对从业者的建议:
5.1 大模型公司:关注强化学习,探索预训练阶段的应用
5.2 大模型应用开发者:结合深度思考能力,升级 RAG 和 Agent 框架
3 算力提供商: 关注推理算力的巨大需求
5.4 定制化公司:提升算力密度,寻找不可替代性,或转型为垂直模型公司
5.5 其他从业者:关注垂直细分领域的机会,寻找差异化竞争优势
结论:DEPSC 引领 AI 行业进入新阶段