导图社区 DeepSeek(深度求索)
这是一篇关于DeepSeek(深度求索)的思维导图,主要内容包括:公司背景,核心模型,技术亮点,国际影响与风险,市场与产业影响。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
IMX6UL(A7)
考试学情分析系统
DeepSeek(深度求索)
公司背景
创始人:梁文锋(High-Flyer创始人)
梁文锋是DeepSeek的创始人,同时也是High-Flyer的创始人,具有丰富的行业经验和领导力。
成立时间:2023年7月
DeepSeek成立于2023年7月,是一家相对较新的公司,但已经取得了显著的成就。
总部:杭州,中国
公司总部设在中国杭州,杭州作为中国的科技中心之一,为DeepSeek提供了良好的发展环境。
团队规模:约160人
公司拥有约160人的团队,这个规模对于一家初创公司来说相对较大,显示出公司的快速成长和扩张。
核心模型
DeepSeekV3
发布日期:2024年12月
DeepSeek-V3模型在2024年12月发布,标志着公司技术实力的一个重要里程碑。
参数规模:6710亿(动态激活37B)
该模型拥有6710亿参数,动态激活37B,显示出其在处理复杂任务时的强大能力。
技术特点
混合专家(MoE)
混合专家机制是DeepSeek-V3的核心技术之一,它允许模型动态激活不同的专家子网络,以适应不同的任务需求。
FP8量化训练
FP8量化训练技术使得模型训练更加高效,同时保持了模型的性能。
自研训练框架
公司开发了自研的训练框架,这表明DeepSeek在技术上具有自主创新能力。
性能对比
超越:Llama-3.1、Qwen-2.5
DeepSeek-V3在性能上超越了Llama-3.1和Qwen-2.5,显示出其在行业中的领先地位。
媲美/超越:GPT-4o、Claude-3.5
该模型在性能上可以媲美甚至超越GPT-4o和Claude-3.5,这进一步证明了DeepSeek的技术实力。
DeepSeek-R1
发布日期:2025年1月
DeepSeek-R1模型在2025年1月发布,是公司产品线的又一重要补充。
开源许可:MIT
该模型采用MIT开源许可,鼓励了社区的参与和贡献,也体现了公司对开源文化的重视。
应用领域:网页、App、API服务
DeepSeek-R1被广泛应用于网页、App和API服务中,显示出其广泛的适用性和灵活性。
市场反响:迅速登顶美区App Store免费榜
该模型一经发布,就迅速登顶美区App Store免费榜,显示出市场对其的高度认可。
技术亮点
混合专家机制(MoE):动态激活专家子网络
混合专家机制是DeepSeek的核心技术之一,它允许模型动态激活不同的专家子网络,以适应不同的任务需求。
低精度量化训练(FP8)
开源战略(MIT许可证)
公司采用MIT开源许可证,鼓励了社区的参与和贡献,也体现了公司对开源文化的重视。
国际影响与风险
监管审查:意大利、美国、韩国、日本
DeepSeek在国际市场上受到了包括意大利、美国、韩国、日本在内的多个国家的监管审查,这对其全球业务构成了挑战。
网络安全风险:曾遭受DDoS攻击
公司曾遭受DDoS攻击,这对其网络安全提出了挑战,也提醒公司在发展的同时需要加强网络安全防护。
市场与产业影响
Nvidia市值震动(单日蒸发近6000亿美元)
DeepSeek-V3的发布对Nvidia市值产生了重大影响,导致其市值单日蒸发近6000亿美元,显示出DeepSeek在市场上的巨大影响力。
推动产业竞争与技术进步
DeepSeek的出现推动了整个产业的竞争和技术进步,促使其他公司加大研发投入,推动了整个行业的技术发展。
成为全球AI研究与产业重要标杆
DeepSeek已经成为全球AI研究与产业的重要标杆,其产品和技术被广泛研究和应用。