De

DeepSeek V3.2

推理大模型

DeepSeek V3.2 (正式版)

发布时间: 2025-12-01

13
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度
暂无数据
最长输出结果
暂无数据
模型类型

推理大模型

发布时间

2025-12-01

模型预文件大小
暂无数据
推理模式
常规模式(Non-Thinking Mode) 思考模式(Thinking Mode) 工具调用

开源和体验地址

代码开源状态
预训练权重开源
DEEPSEEK LICENSE AGREEMENT - 免费商用授权
GitHub 源码
暂无GitHub开源地址
Hugging Face
在线体验

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
接口价格
暂无公开的 API 定价信息。

DeepSeek V3.2模型在各大评测榜单的评分

当前尚无可展示的评测数据。

发布机构

DeepSeek V3.2 (正式版)模型解读

DeepSeek V3.2 简介与定位

DeepSeek V3.2 为 V3.2 系列的正式版,官方将 App、Web 与 API 的默认服务从 V3.2-Exp 升级为 V3.2。其设计目标是在通用问答与 Agent 任务场景中平衡思考推理能力与输出长度,并在同一模型下同时支持思考模式与非思考模式。

架构与训练要点

V3.2 系列承袭此前在 V3.2-Exp 中引入的稀疏注意力方向探索(如 DeepSeek Sparse Attention, DSA)等长上下文效率优化思路,并在正式版中结合更大规模的后训练与强化学习管线(官方称包含面向智能体的合成任务与大规模 RL 训练),以提升泛化能力与工具使用中的鲁棒性。

能力与模态

模型为文本向通用大语言模型,官方强调其在通用问答、工具使用与 Agent 评测集上的表现,且在思考模式与非思考模式下均可进行工具调用(区别于过往版本思考模式下无法使用工具)。

性能与评测

官方材料给出在多项智能体工具调用评测集中的对比结果,指向当前开源模型的领先水平;文档未提供统一的参数规模与完整基准表的全部原始数值,本站保持对官方表格的描述性转述。

访问与开源

V3.2 已在官网 Web、App 与 API 上线;开源仓库提供权重/模型卡,并可通过官方聊天入口进行交互体验。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat