DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表DeepSeek-V3-0324
DE

DeepSeek-V3-0324

聊天大模型

DeepSeek-V3-0324

发布时间: 2025-03-24更新于: 2025-08-23 00:59:581,650
在线体验GitHubHugging FaceCompare
模型参数
6710亿
上下文长度
128K
中文支持
支持
推理能力

DeepSeek-V3-0324 是由 DeepSeek-AI 发布的 AI 模型,发布时间为 2025-03-24,定位为 聊天大模型,参数规模约为 6710.0B,上下文长度为 128K,模型文件大小约 1442GB,采用 MIT License 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

DeepSeek-V3-0324

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
128K tokens
最大输出长度
暂无数据
模型类型
聊天大模型
发布时间
2025-03-24
模型文件大小
1442GB
MoE架构
是
总参数 / 激活参数
6710 亿 / 370 亿
知识截止
暂无数据
DeepSeek-V3-0324

开源和体验地址

代码开源状态
MIT License
预训练权重开源
MIT License- 免费商用授权
GitHub 源码
https://github.com/deepseek-ai/DeepSeek-V3
Hugging Face
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
在线体验
https://chat.deepseek.com
DeepSeek-V3-0324

官方介绍与博客

官方论文
暂无官方论文
DataLearnerAI博客
DeepSeekV3-0324发布:DeepSeek V3基础上大幅升级推理能力和前端网页的美观度,多项评测结果超过GPT-4.5
DeepSeek-V3-0324

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.27$1.1
DeepSeek-V3-0324

评测结果

DeepSeek-V3-0324 当前已收录的代表性评测结果包括 GSM8K(3 / 26,得分 96.30)、GPQA(2 / 14,得分 68.40)、DROP(3 / 9,得分 89.70)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部常规
工具使用
全部使用工具不使用工具

综合评估

共 6 项评测
评测名称 / 模式
得分
排名/总数
MMLU
常规模式
86.50
28 / 65
MMLU Pro
常规模式
81.20
50 / 124
GPQA Diamond
常规模式
68.40
116 / 175
GPQA
常规模式
68.40
2 / 14
ARC-AGI
常规模式
9
59 / 65
HLE
常规模式
5.20
142 / 149

数学推理

共 7 项评测
评测名称 / 模式
得分
排名/总数
GSM8K
常规模式
96.30
3 / 26
MATH-500
常规模式
94
28 / 44
AIME 2024
常规模式
59.40
43 / 62
AIME2025
常规模式
47.70
88 / 106
IMO-ProofBench
常规模式
4.30
15 / 16
IMO 2024
常规模式
1.70
9 / 10
IMO 2025
常规模式
1.70
9 / 9

阅读理解

共 1 项评测
评测名称 / 模式
得分
排名/总数
DROP
常规模式
89.70
3 / 9

常识问答

共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQA
常规模式
27.20
26 / 45

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
常规模式
49.20
91 / 118
SWE-bench Verified
常规模式
38.80
94 / 103

写作和创作

共 1 项评测
评测名称 / 模式
得分
排名/总数
Creative Writing
常规模式
81.60
15 / 23

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal-Bench
常规模式
13.30
34 / 35

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Bench
常规模式
27.20
22 / 27

Agent能力评测

共 2 项评测
评测名称 / 模式
得分
排名/总数
Aider-Polyglot
常规模式
55.10
21 / 26
τ²-Bench
常规模式工具
38.80
36 / 40
查看评测深度分析与其他模型对比
DeepSeek-V3-0324

发布机构

DeepSeek-AI
DeepSeek-AI
查看发布机构详情
DeepSeek-V3-0324

模型解读

DeepSeek-AI开源的DeepSeekV3更新版本,版本号是0324,是2025年3月24日上传到HuggingFace上并以MIT协议开源。


根据模型提供的配置信息,DeepSeekV3-0324依然是MoE大模型,包含256个路由专家和1个共享专家,每个token使用8个专家推理。DeepSeekV3-0324通过RoPE可以扩展到最高163840上下文长度(160K)。模型词汇表大小是129280个。与DeepSeekV3相比,这些参数都没有变化,这意味着大概率是原有模型继续训练或者后训练的结果~


集成 LoRA 机制,支持轻量级微调。


目前暂无其它信息披露。



2025年3月25日,官方更新了更多的升级内容。总结如下:

DeepSeekV3-0324模型的升级很多

尽管模型架构等技术方面没有变化,但是相比较DeepSeek V3,DeepSeek V3-0324升级却很多,核心是推理能力显著增强。主要总结如下:

前端开发能力优化

针对开发者关心的代码生成质量方面,DeepSeekV3-0324的能力显著增强,主要包括:

  • 生成代码的可执行性明显改善
  • 网页和游戏前端界面的视觉美观度提升
  • 更符合现代Web开发实践要求

在第二点中,已经有多人一句话生成了800行前端网页,很美观。如下图所示:



内容生成质量提升

在官方的介绍中,DeepSeek V3-0324在文本生成质量方面也有明显提示,看介绍应该是用了R1生成的结果做了后训练:

  • 严格对齐R1写作风格标准
  • 中长篇内容的结构完整性和内容深度增强
  • 文学性和专业性表达更加自然流畅

此外,在多轮对话和交互方面也有提升:

  • 多轮对话的上下文连贯性改善
  • 支持更精准的交互式内容重写
  • 翻译质量和正式信函写作能力提升
中文搜索增强

为了支持更好的联网生成效果,DeepSeek V3-0324在报告类请求的分析深度和输出细节方面也有增强,具体来说有如下2点提升:

  1. 搜索结果整合能力优化
  2. 支持更复杂的商业分析场景
函数调用改进

最后,DeepSeek V3-0324在函数调用方面也有了优化,主要修复了此前V3版本中的函数调用准确性问题,这意味着在构建AI Agent应用中,DeepSeek V3-0324可能会有更好的效果,具体包含:

  • API响应稳定性和可靠性提升
  • 复杂参数处理能力增强


DeepSeek V3-0324的评测结果

DeepSeek-V3-0324在多个权威基准测试中展现出突破性进步,相比较DeepSeek V3,DeepSeek V3-0324在多个评测指标中都有显著提升:

  • MMLU-Pro:从75.9提升至81.2(+5.3)
  • GPQA:从59.1跃升至68.4(+9.3)
  • AIME:实现最大幅度提升,从39.6飙升至59.4(+19.8)
  • LiveCodeBench:从39.2进步到49.2(+10.0)

而根据DataLearnerAI的大模型官方评测排行榜,以MMLU Pro这种高难度综合知识评测为例,DeepSeek V3-0324已经是仅次于GPT-4.5的非推理大模型。

数据来源: https://www.datalearner.com/ai-models/ai-benchmarks-tests/benchmarks-for-all 


甚至,在AIME2024的评测中,DeepSeekV3-0324甚至超过了Grok3,成为仅次于DeepSeek-R1的模型。


数据来源DataLearnerAI大模型对比评测工具: https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=16,32,36,37,40&modelInputString=543,515,488,492,496,508 

而在LiveCodeBench的编程方面也是非常强悍!


关于DeepSeek V3-0324更多的介绍参考DataLearner博客: https://www.datalearner.com/blog/1051742900777784 

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码