DeepSeek-AI

DeepSeek-AI

机构简介与发布的大模型

www.deepseek.com

机构介绍

机构概况

DeepSeek(深度求索)是中国领先的大模型企业,由知名量化私募幻方量化(High-Flyer)孵化,总部位于杭州,致力于探索通用人工智能的本质。公司以开源著称,其模型与代码可自由下载、修改和使用,凭借架构创新与极致的训练成本控制在全球范围内产生了广泛影响。

创立与发展

  • 2023 年 7 月成立,依托幻方量化在 GPU 算力与工程上的深厚积累,由 梁文锋(Liang Wenfeng) 领军。
  • 2024 年 12 月开源 DeepSeek-V3,以远低于行业的成本训练出媲美全球顶尖闭源模型的效果。
  • 2025 年 1 月开源推理大模型 DeepSeek-R1,性能接近 OpenAI o1 且完全开源,其 AI 助手一度登顶多国 App Store,引发全球关注与"DeepSeek 时刻"。

旗舰模型

  • 通用 / 推理:最新旗舰为 DeepSeek-V4(含 V4-Pro、V4-Flash),延续 V3.1 / V3.2 系列的高效 MoE 架构
  • 数学 / 证明:DeepSeekMath-V2、DeepSeek-Prover-V2
  • 多模态 / OCR:DeepSeek-VL 系列、DeepSeek-OCR / OCR 2
  • 编程:DeepSeek-Coder 系列

最新进展(2026 年)

  • 启动公司首轮大规模外部融资,规模约 70+ 亿美元(约 500 亿人民币),估值约 520–590 亿美元
  • 投资方涵盖腾讯、宁德时代、京东等,创始人梁文锋个人认购约占本轮 40%。

领导者:梁文锋(创始人) 官网:deepseek.com

开源主页:github.com/deepseek-ai 在线助手:chat.deepseek.com

注:本节融资与估值数据为 2026 年年中公开信息,可能随时间变化。

模型产品线发布时间线

各产品线的代际演进 · 圆点 = 单个模型发布 · 虚线串联同产品线各代 · 悬停查看详情

模型数
13
时间跨度
359
平均发布间隔
30

发布的大模型

共 38 个模型,6 个类别

DeepSeek-AI发布的大模型,按类型分类展示

DeepSeek V4

推理大模型2
首发
2026-04-24
最新
2026-04-24
持续
1 天
模型数
2 个

DeepSeek OCR 2

多模态大模型1
首发
2026-01-28
最新
2026-01-28
持续
1 天
模型数
1 个

DeepSeek V3.2

推理大模型3
首发
2025-09-29
最新
2025-12-01
持续
64 天
模型数
3 个

DeepSeekMath V2

推理大模型1
首发
2025-11-27
最新
2025-11-27
持续
1 天
模型数
1 个

DeepSeek OCR

视觉大模型1
首发
2025-10-20
最新
2025-10-20
持续
1 天
模型数
1 个

DeepSeek V3.1

聊天大模型2
首发
2025-08-20
最新
2025-09-22
持续
34 天
模型数
2 个

DeepSeek R1

推理大模型3
首发
2025-01-20
最新
2025-05-28
持续
129 天
模型数
3 个

DeepSeek Prover V2

基础大模型1
首发
2025-04-30
最新
2025-04-30
持续
1 天
模型数
1 个

DeepSeek V3

聊天大模型2基础大模型1
首发
2024-12-26
最新
2025-03-24
持续
89 天
模型数
3 个

DeepSeek R1 Lite

推理大模型1
首发
2024-11-20
最新
2024-11-20
持续
1 天
模型数
1 个

DeepSeek V2.5

基础大模型1
首发
2024-09-05
最新
2024-09-05
持续
1 天
模型数
1 个

DeepSeek V2

聊天大模型1基础大模型1
首发
2024-05-06
最新
2024-05-06
持续
1 天
模型数
2 个

DeepSeekMoE

聊天大模型2基础大模型2
首发
2024-01-11
最新
2024-01-11
持续
1 天
模型数
4 个

DeepSeek LLM

基础大模型2聊天大模型2
首发
2023-11-29
最新
2023-11-29
持续
1 天
模型数
4 个

DeepSeek Coder

编程大模型2
首发
2023-11-01
最新
2023-11-01
持续
1 天
模型数
2 个