
机构介绍
DeepSeek是幻方量化旗下的一家大模型企业。幻方量化是中国知名的私募巨头,根据此前的信息,幻方量化有1万多张A100显卡,在美国显卡禁令之前用于量化投资。
DeepSeek成立与2023年7月份,致力于探索人工智能本质。他们发布了多个开源大语言模型,包括DeepSeek LLM、DeepSeek Coder等多个模型,在多项评测中都有非常好的表现。
2024年12月,DeepSeekAI开源DeepSeek V3模型,因为其良好的性能、巨大的创新和友好的开源协议引起了国内外广泛的关注。特别是其架构的创新,用较低的成本训练出媲美全球顶尖模型的效果进而引起了大家的关注。
2025年1月20日,DeepSeekAI开源了DeepSeek R1推理大模型,其性能接近OpenAI的o1模型,且完全开源,再次引起了全球的关注。DeepSeek-R1发布后,其AI助手迅速成为苹果iPhone应用商店中下载量最高的免费应用。这一快速崛起引发了美国科技行业的关注,分析师担忧DeepSeek的高效和低成本模式可能会对美国产生竞争压力。
开源战略
与许多竞争对手不同,DeepSeek坚持开源,其模型和代码均可免费下载、修改和使用。这一策略促进了行业合作,加快了AI技术的创新步伐。
DeepSeek的GitHub开源地址: https://github.com/deepseek-ai
DeepSeek官方的大模型地址: https://chat.deepseek.com/
发布的大模型
共 36 个模型,6 个类别
DeepSeek-AI发布的大模型,按类型分类展示
推理大模型
12 个模型DeepSeek V4开源
0.0亿参数2026-02-17
DeepSeek V3.2 Speciale开源
0.0亿参数2025-12-01
DeepSeek V3.2开源
6710.0亿参数2025-12-01
DeepSeekMath-V2开源
6850.0亿参数2025-11-27
DeepSeek V3.2-Exp开源
6710.0亿参数2025-09-29
DeepSeek-R1-0528-Qwen3-8B开源
80.0亿参数2025-05-30
DeepSeek-R1-0528开源
6710.0亿参数2025-05-28
DeepSeek-R1-Distill-Qwen-7B开源
70.0亿参数2025-01-20
DeepSeek-R1-Distill-Llama-70B开源
700.0亿参数2025-01-20
DeepSeek-R1-Zero开源
6710.0亿参数2025-01-20
DeepSeek-R1开源
6710.0亿参数2025-01-20
DeepSeek-R1-Lite-Preview开源
2024-11-20
多模态大模型
5 个模型视觉大模型
1 个模型聊天大模型
8 个模型DeepSeek-V3.1 Terminus开源
6710.0亿参数2025-09-22
DeepSeek-V3.1开源
6710.0亿参数2025-08-20
DeepSeek-V3-0324开源
6710.0亿参数2025-03-24
DeepSeek-V3开源
6810.0亿参数2024-12-26
DeepSeek-V2-236B-Chat开源
2360.0亿参数2024-05-06
DeepSeekMoE 145B Chat开源
1446.0亿参数2024-01-11
DeepSeek LLM 67B Chat开源
670.0亿参数2023-11-29
DeepSeek LLM 7B Chat开源
70.0亿参数2023-11-29
基础大模型
8 个模型DeepSeek-Prover-V2开源
6710.0亿参数2025-04-30
DeepSeek-V3-Base开源
6810.0亿参数2024-12-26
DeepSeek V2.5开源
2360.0亿参数2024-09-05
DeepSeek-V2-236B开源
2360.0亿参数2024-05-06
DeepSeekMoE 145B Base开源
1446.0亿参数2024-01-11
DeepSeekMoE 16B Base开源
164.0亿参数2024-01-11
DeepSeek LLM 7B Base开源
70.0亿参数2023-11-29
DeepSeek LLM 67B Base开源
670.0亿参数2023-11-29