DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表DeepSeek V3.2-Exp
DE

DeepSeek V3.2-Exp

DeepSeek-V3.2-Exp

发布时间: 2025-09-29更新于: 2025-10-08 11:33:081,387
在线体验GitHubHugging FaceCompare
模型参数
6710.0亿
上下文长度
128K
中文支持
不支持
推理能力

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

DeepSeek V3.2-Exp

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
128K tokens
最大输出长度
64000 tokens
模型类型
推理大模型
发布时间
2025-09-29
模型文件大小
1342GB
MoE架构
是
总参数 / 激活参数
6710.0 亿 / 370 亿
知识截止
暂无数据
DeepSeek V3.2-Exp

开源和体验地址

代码开源状态
MIT License
预训练权重开源
MIT License- 免费商用授权
GitHub 源码
https://github.com/deepseek-ai/DeepSeek-V3.2-Exp
Hugging Face
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
在线体验
https://chat.deepseek.com
DeepSeek V3.2-Exp

官方介绍与博客

官方论文
DeepSeek-V3.2-Exp: Boosting Long-Context Efficiency with DeepSeek Sparse Attention
DataLearnerAI博客
暂无介绍博客
DeepSeek V3.2-Exp

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.28$0.42
缓存计费Cache
模态输入 Cache输出 Cache
文本$0.028--
DeepSeek V3.2-Exp

评测结果

思考模式
思考模式细分 (2)
工具使用

综合评估

共 1 项评测
评测名称 / 模式
得分
排名/总数
HLE
开启使用工具
20.30
64 / 114

常识问答

共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQA
开启使用工具
97.10
1 / 45

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
SWE-bench Verified
开启使用工具
67.80
52 / 90

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal-Bench
开启使用工具
37.70
14 / 35

Agent能力评测

共 3 项评测
评测名称 / 模式
得分
排名/总数
Aider-Polyglot
开启使用工具
74.50
7 / 26
τ²-Bench
开启使用工具
66.70
25 / 39
τ²-Bench - Telecom
开启使用工具
34
32 / 33

AI Agent - 信息收集

共 1 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
开启使用工具
40.10
29 / 33
查看评测深度分析与其他模型对比
DeepSeek V3.2-Exp

发布机构

DeepSeek-AI
DeepSeek-AI
查看发布机构详情
DeepSeek-V3.2-Exp

模型解读

概述

DeepSeek-V3.2-Exp 是 DeepSeek 在 2025-09-29 发布的 v3.2 实验版子型号,基于 V3.1-Terminus 持续训练并首次引入 DeepSeek Sparse Attention (DSA),旨在提升长上下文训练与推理效率,同时维持与 V3.1-Terminus 相当的输出质量。该模型已在 App、Web 与 API 同步上线,且 API 定价整体下调 50%+。

来源:发布新闻;Models & Pricing;Hugging Face 模型页。

架构与规格

  • 核心机制:DSA(稀疏注意力),用于在长上下文场景降低算力与显存开销。
  • 上下文窗口:官方定价页标注 128K tokens。
  • 最大输出:非思考模式默认/上限 4K/8K;思考模式默认/上限 32K/64K。
  • 开源情况与许可:模型权重与仓库以 MIT License 发布;TileLang/CUDA 等关键算子开源。

能力与模态

  • 文本对话:支持 JSON 输出、前缀补全(Beta)、FIM(非思考)、函数调用(非思考)。
  • 多模态:该子型号官方定价/文档未提供图像、音频、视频或 embedding 的计费与接入说明。

性能与对比

官方公开信息显示,V3.2-Exp 在公开基准上的表现整体与 V3.1-Terminus 持平(用于验证 DSA 引入对质量的影响有限)。

访问与集成

  • API:deepseek-chat(非思考模式)与 deepseek-reasoner(思考模式)已升级对应到 V3.2-Exp。
  • 在线体验:官方 Web 聊天支持该子型号。
  • 开源权重:Hugging Face 提供权重与使用示例。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码