DeepSeek V3.2vsDeepSeek-V3-0324

在 8 个共同 benchmark 中,DeepSeek V3.2 整体领先:DeepSeek V3.2 领先 8 项,DeepSeek-V3-0324 领先 0 项,持平 0 项,平均分差 +31.50。

DeepSeek-AI
DeepSeek V3.2

DeepSeek-AI · 2025-12-01 · 推理大模型

DeepSeek-AI
DeepSeek-V3-0324

DeepSeek-AI · 2025-03-24 · 聊天大模型

DeepSeek V3.28 (100%)(0%)0 DeepSeek-V3-0324

评测分数

按能力类目分组,每组内按分差大小排列;共 8 项。

General Knowledge

DeepSeek V3.2 领先 3/3
评测项DeepSeek V3.2DeepSeek-V3-0324分差
ARC-AGI5738 / 65Thinking (No Tools)959 / 65+48
HLE25.1087 / 157Thinking (No Tools)5.20150 / 157+19.90
GPQA Diamond82.4064 / 178Thinking (No Tools)68.40119 / 178+14

Agent Level Benchmark

DeepSeek V3.2 领先 2/2
评测项DeepSeek V3.2DeepSeek-V3-0324分差
τ²-Bench80.3014 / 4038.8036 / 40+41.50
Aider-Polyglot69.9012 / 2655.1021 / 26+14.80

Coding and Software Engineer

DeepSeek V3.2 领先 2/2
评测项DeepSeek V3.2DeepSeek-V3-0324分差
SWE-bench Verified73.1045 / 10838.8099 / 108+34.30
LiveCodeBench83.3021 / 120Thinking (No Tools)49.2093 / 120+34.10

Math and Reasoning

DeepSeek V3.2 领先 1/1
评测项DeepSeek V3.2DeepSeek-V3-0324分差
AIME202593.1030 / 106Thinking (No Tools)47.7088 / 106+45.40

规格对比

字段DeepSeek V3.2DeepSeek-V3-0324
发布机构DeepSeek-AIDeepSeek-AI
发布时间2025-12-012025-03-24
模型类型推理大模型聊天大模型
架构MoE 架构MoE 架构
参数规模6710亿6710亿
上下文长度128K128K
最大输出8K暂无数据

小结

  • DeepSeek V3.2在以下类目领先:General Knowledge (3/3)、Agent Level Benchmark (2/2)、Coding and Software Engineer (2/2)、Math and Reasoning (1/1)

8 个共同 benchmark 上,DeepSeek V3.2 平均高出 31.50 分。

单项差距最大的 benchmark:ARC-AGI — DeepSeek V3.2 57,DeepSeek-V3-0324 9(分差 +48)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。