DataLearner logoDataLearnerAI
Latest AI Insights
Model Leaderboards
Benchmarks
Model Directory
Model Comparison
Resource Center
Tools
LanguageEnglish
DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

Products

  • Leaderboards
  • Model comparison
  • Datasets

Resources

  • Tutorials
  • Editorial
  • Tool directory

Company

  • About
  • Privacy policy
  • Data methodology
  • Contact

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

Privacy policyTerms of service
Page navigation
目录
Model catalogDeepSeek-V3-0324
DE

DeepSeek-V3-0324

聊天大模型

DeepSeek-V3-0324

Release date: 2025-03-24更新于: 2025-08-23 00:59:581,650
Live demoGitHubHugging FaceCompare
Parameters
671B
Context length
128K
Chinese support
Supported
Reasoning ability

DeepSeek-V3-0324 is an AI model published by DeepSeek-AI, released on 2025-03-24, for 聊天大模型, with 6710.0B parameters, and 128K tokens context length, requiring about 1442GB storage, under the MIT License license.

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

DeepSeek-V3-0324

Model basics

Reasoning traces
Not supported
Thinking modes
Thinking modes not supported
Context length
128K tokens
Max output length
No data
Model type
聊天大模型
Release date
2025-03-24
Model file size
1442GB
MoE architecture
Yes
Total params / Active params
671B / 37B
Knowledge cutoff
No data
DeepSeek-V3-0324

Open source & experience

Code license
MIT License
Weights license
MIT License- 免费商用授权
GitHub repo
https://github.com/deepseek-ai/DeepSeek-V3
Hugging Face
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
Live demo
https://chat.deepseek.com
DeepSeek-V3-0324

Official resources

Paper
No paper available
DataLearnerAI blog
DeepSeekV3-0324发布:DeepSeek V3基础上大幅升级推理能力和前端网页的美观度,多项评测结果超过GPT-4.5
DeepSeek-V3-0324

API details

API speed
3/5
💡Default unit: $/1M tokens. If vendors use other units, follow their published pricing.
Standard pricingStandard
ModalityInputOutput
Text$0.27$1.1
DeepSeek-V3-0324

Benchmark Results

DeepSeek-V3-0324 currently shows benchmark results led by GSM8K (3 / 26, score 96.30), GPQA (2 / 14, score 68.40), DROP (3 / 9, score 89.70). This page also consolidates core specs, context limits, and API pricing so you can evaluate the model from benchmark results and deployment constraints together.

Thinking
All modesNormal
Tool usage
All modesWith toolsNo tools

综合评估

6 evaluations
Benchmark / mode
Score
Rank/total
MMLU
Standard Mode
86.50
28 / 65
MMLU Pro
Standard Mode
81.20
50 / 124
GPQA Diamond
Standard Mode
68.40
116 / 175
GPQA
Standard Mode
68.40
2 / 14
ARC-AGI
Standard Mode
9
59 / 65
HLE
Standard Mode
5.20
142 / 149

数学推理

7 evaluations
Benchmark / mode
Score
Rank/total
GSM8K
Standard Mode
96.30
3 / 26
MATH-500
Standard Mode
94
28 / 44
AIME 2024
Standard Mode
59.40
43 / 62
AIME2025
Standard Mode
47.70
88 / 106
IMO-ProofBench
Standard Mode
4.30
15 / 16
IMO 2024
Standard Mode
1.70
9 / 10
IMO 2025
Standard Mode
1.70
9 / 9

阅读理解

1 evaluations
Benchmark / mode
Score
Rank/total
DROP
Standard Mode
89.70
3 / 9

常识问答

1 evaluations
Benchmark / mode
Score
Rank/total
SimpleQA
Standard Mode
27.20
26 / 45

编程与软件工程

2 evaluations
Benchmark / mode
Score
Rank/total
LiveCodeBench
Standard Mode
49.20
91 / 118
SWE-bench Verified
Standard Mode
38.80
94 / 103

写作和创作

1 evaluations
Benchmark / mode
Score
Rank/total
Creative Writing
Standard Mode
81.60
15 / 23

AI Agent - 工具使用

1 evaluations
Benchmark / mode
Score
Rank/total
Terminal-Bench
Standard Mode
13.30
34 / 35

常识推理

1 evaluations
Benchmark / mode
Score
Rank/total
Simple Bench
Standard Mode
27.20
22 / 27

Agent能力评测

2 evaluations
Benchmark / mode
Score
Rank/total
Aider-Polyglot
Standard Mode
55.10
21 / 26
τ²-Bench
Standard ModeTools
38.80
36 / 40
View benchmark analysisCompare with other models
DeepSeek-V3-0324

Publisher

DeepSeek-AI
DeepSeek-AI
View publisher details
DeepSeek-V3-0324

Model Overview

DeepSeek-AI开源的DeepSeekV3更新版本,版本号是0324,是2025年3月24日上传到HuggingFace上并以MIT协议开源。


根据模型提供的配置信息,DeepSeekV3-0324依然是MoE大模型,包含256个路由专家和1个共享专家,每个token使用8个专家推理。DeepSeekV3-0324通过RoPE可以扩展到最高163840上下文长度(160K)。模型词汇表大小是129280个。与DeepSeekV3相比,这些参数都没有变化,这意味着大概率是原有模型继续训练或者后训练的结果~


集成 LoRA 机制,支持轻量级微调。


目前暂无其它信息披露。



2025年3月25日,官方更新了更多的升级内容。总结如下:

DeepSeekV3-0324模型的升级很多

尽管模型架构等技术方面没有变化,但是相比较DeepSeek V3,DeepSeek V3-0324升级却很多,核心是推理能力显著增强。主要总结如下:

前端开发能力优化

针对开发者关心的代码生成质量方面,DeepSeekV3-0324的能力显著增强,主要包括:

  • 生成代码的可执行性明显改善
  • 网页和游戏前端界面的视觉美观度提升
  • 更符合现代Web开发实践要求

在第二点中,已经有多人一句话生成了800行前端网页,很美观。如下图所示:



内容生成质量提升

在官方的介绍中,DeepSeek V3-0324在文本生成质量方面也有明显提示,看介绍应该是用了R1生成的结果做了后训练:

  • 严格对齐R1写作风格标准
  • 中长篇内容的结构完整性和内容深度增强
  • 文学性和专业性表达更加自然流畅

此外,在多轮对话和交互方面也有提升:

  • 多轮对话的上下文连贯性改善
  • 支持更精准的交互式内容重写
  • 翻译质量和正式信函写作能力提升
中文搜索增强

为了支持更好的联网生成效果,DeepSeek V3-0324在报告类请求的分析深度和输出细节方面也有增强,具体来说有如下2点提升:

  1. 搜索结果整合能力优化
  2. 支持更复杂的商业分析场景
函数调用改进

最后,DeepSeek V3-0324在函数调用方面也有了优化,主要修复了此前V3版本中的函数调用准确性问题,这意味着在构建AI Agent应用中,DeepSeek V3-0324可能会有更好的效果,具体包含:

  • API响应稳定性和可靠性提升
  • 复杂参数处理能力增强


DeepSeek V3-0324的评测结果

DeepSeek-V3-0324在多个权威基准测试中展现出突破性进步,相比较DeepSeek V3,DeepSeek V3-0324在多个评测指标中都有显著提升:

  • MMLU-Pro:从75.9提升至81.2(+5.3)
  • GPQA:从59.1跃升至68.4(+9.3)
  • AIME:实现最大幅度提升,从39.6飙升至59.4(+19.8)
  • LiveCodeBench:从39.2进步到49.2(+10.0)

而根据DataLearnerAI的大模型官方评测排行榜,以MMLU Pro这种高难度综合知识评测为例,DeepSeek V3-0324已经是仅次于GPT-4.5的非推理大模型。

数据来源: https://www.datalearner.com/ai-models/ai-benchmarks-tests/benchmarks-for-all 


甚至,在AIME2024的评测中,DeepSeekV3-0324甚至超过了Grok3,成为仅次于DeepSeek-R1的模型。


数据来源DataLearnerAI大模型对比评测工具: https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=16,32,36,37,40&modelInputString=543,515,488,492,496,508 

而在LiveCodeBench的编程方面也是非常强悍!


关于DeepSeek V3-0324更多的介绍参考DataLearner博客: https://www.datalearner.com/blog/1051742900777784 

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码