DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表DeepSeek V3.2
DE

DeepSeek V3.2

推理大模型

DeepSeek V3.2 (正式版)

发布时间: 2025-12-01更新于: 2026-04-08 15:40:09.1183,391
在线体验GitHubHugging FaceCompare
模型参数
6710.0亿
上下文长度
128K
中文支持
支持
推理能力

DeepSeek V3.2 是 DeepSeek 于2026年1月发布的通用旗舰模型,671B 参数,采用 DSA 稀疏注意力机制,结合大规模强化学习与 agent 任务合成训练,性能对标 GPT-5,支持工具调用与思考模式,MIT 协议开源。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

DeepSeek V3.2

模型基本信息

推理过程
支持
思考模式
思考水平 · 开启 (On) (默认)思考水平 · 关闭 (Off)
上下文长度
128K tokens
最大输出长度
8192 tokens
模型类型
推理大模型
发布时间
2025-12-01
模型文件大小
1.34TB
MoE架构
是
总参数 / 激活参数
6710.0 亿 / 370 亿
知识截止
暂无数据
DeepSeek V3.2

开源和体验地址

代码开源状态
DEEPSEEK LICENSE AGREEMENT
预训练权重开源
DEEPSEEK LICENSE AGREEMENT- 免费商用授权
GitHub 源码
https://github.com/deepseek-ai/DeepSeek-V3.2-Exp
Hugging Face
https://huggingface.co/deepseek-ai/DeepSeek-V3.2
在线体验
https://chat.deepseek.com
DeepSeek V3.2

官方介绍与博客

官方论文
DeepSeek-V3.2 正式版发布与说明
DataLearnerAI博客
复杂问题推理能力大幅提升,DeepSeekAI发布DeepSeek V3.2正式版本以及一个评测结果可以媲美Gemini 3.0 Pro的将开源模型推到极限性能的DeepSeek-V3.2-Speciale模型
DeepSeek V3.2

API接口信息

接口速度
3/5
暂无公开的 API 定价信息。
DeepSeek V3.2

评测结果

DeepSeek V3.2 当前已收录的代表性评测结果包括 LiveCodeBench(13 / 109,得分 83.30)、AIME2025(30 / 107,得分 93.10)、GPQA Diamond(53 / 166,得分 82.40)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部思考
思考模式细分 (1)
全部默认 (开启)
工具使用
全部使用工具不使用工具

综合评估

共 4 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamond
开启
82.40
53 / 166
ARC-AGI
开启
57
28 / 56
HLE
开启
25.10
62 / 128
ARC-AGI-2
开启
4
39 / 50

编程与软件工程

共 5 项评测
评测名称 / 模式
得分
排名/总数
CodeForces
开启
2386
7 / 10
LiveCodeBench
开启
83.30
13 / 109
SWE-bench Verified
开启
70.20
43 / 95
SWE-bench Verified
开启工具
73.10
32 / 95
SWE-Bench Pro - Public
开启
40.90
19 / 24

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
AIME2025
开启
93.10
30 / 107
AIME 2026
开启
92.70
5 / 11

Agent能力评测

共 2 项评测
评测名称 / 模式
得分
排名/总数
τ²-Bench
开启工具
80.30
14 / 40
Aider-Polyglot
开启工具
69.90
12 / 26

AI Agent - 信息收集

共 1 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
开启
51.40
25 / 35

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal Bench 2.0
开启工具
46.40
24 / 31

OpenClaw智能体能力综合测评

共 2 项评测
评测名称 / 模式
得分
排名/总数
Pinch Bench
开启工具
84.30
18 / 37
Claw Bench
开启工具
79
20 / 27
查看评测深度分析与其他模型对比
DeepSeek V3.2

发布机构

DeepSeek-AI
DeepSeek-AI
查看发布机构详情
DeepSeek V3.2 (正式版)

模型解读

DeepSeek V3.2 系列共包含三个版本:V3.2-Exp、V3.2 正式版和 V3.2-Speciale。V3.2-Exp 是2025年9月发布的实验版本,用于验证新架构;V3.2 正式版于2026年1月发布,是完成完整后训练流程的通用旗舰版本;V3.2-Speciale 是同期发布的高算力推理变体,专为极限推理场景设计。

DeepSeek V3.2 正式版于2026年1月10日发布,总参数 671B,每个 token 激活 37B 参数,上下文窗口 128K,知识截止日期为2025年5月,MIT 协议开源。架构上沿用了 V3.2-Exp 已验证的 DSA 稀疏注意力机制,但后训练部分做了大幅扩展,是 V3.2 系列中面向通用场景的完整产品版本。

后训练阶段,DeepSeek 在 V3.2 上做了两项较大的投入。一是大幅扩展强化学习的计算预算,后训练阶段消耗的算力超过预训练总量的 10%,通过规模化 RL 来提升模型的推理与规划能力,而不只是依赖预训练数据的堆砌。二是构建了大规模 agent 任务合成流水线,覆盖超过 1,800 个不同环境和 85,000 个 agent 任务,涵盖搜索、编程、工具调用等场景,为 RL 训练提供数据支撑。这批合成任务的难度足够高——即使是 frontier 闭源模型在这些任务上的准确率也不超过 62%,确保了 RL 训练的有效性。

V3.2 也是 DeepSeek 首个将思考链整合进工具调用流程的模型,同时支持思考模式和非思考模式下的工具调用。这使得模型在执行多步 agent 任务时,可以在调用外部工具之前先生成推理过程,而不是直接执行。

性能方面,V3.2 在多个推理 benchmark 上达到了与 GPT-5 和 Kimi K2-thinking 相近的水平,在 agent 场景下的表现也显著缩小了与闭源前沿模型的差距。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码