DeepSeek-V3.1

Name: DeepSeek-V3.1
Price: 0.28 USD
Availability: InStock
Author: DeepSeek-AI

聊天大模型DeepSeek VDeepSeek V3.1

DeepSeek-V3.1

发布时间: 2025-08-20更新于: 2026-07-17 23:18:34.5272,720

在线体验GitHubHugging Face Compare

模型参数

6710亿

上下文长度

128K

中文支持

支持

推理能力

DeepSeek-V3.1 是DeepSeek-AI于 2025-08-20 发布的聊天大模型。支持文本输入和文本输出，上下文窗口为 128K，主要能力包括推理大模型、多语言。页面已收录官方资料、API 定价、公开评测，便于核对规格和使用成本。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

DeepSeek-V3.1

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

128K tokens

最大输出长度

8K tokens

模型类型

聊天大模型

输入/输出模态

文本 → 文本

发布时间

2025-08-20

模型文件大小

1340GB

MoE架构

是

总参数 / 激活参数

6710亿 / 370亿

知识截止

暂无数据

DeepSeek-V3.1

开源和体验地址

代码开源状态

MIT License

预训练权重开源

MIT License- 免费商用授权

GitHub 源码

暂无GitHub开源地址

Hugging Face

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

在线体验

https://chat.deepseek.com/

DeepSeek-V3.1

官方介绍与博客

官方论文

DeepSeek-V3.1 Release

DataLearnerAI博客

DeepSeek V4没有等到，但是DeepSeekAI把DeepSeek V3升级到DeepSeek V3.1了，小幅更新，但核心架构和参数不变

DeepSeek-V3.1

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$0.560/ 1M	$1.68/ 1M

批量模式

类型	适用条件	输入	输出
文本	-	$0.280/ 1M	$0.840/ 1M

缓存定价Prompt缓存

类型	有效期	写入	读取
文本	-	$0.560/ 1M	$0.280/ 1M

DeepSeek-V3.1

评测结果

DeepSeek-V3.1 当前已收录的代表性评测结果包括 MMLU（1 / 66，得分 93.40）、SimpleQA（4 / 47，得分 93.40）、AIME 2024（7 / 62，得分 93.10）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 7 项评测

评测名称 / 模式

得分

排名/总数

MMLU

93.40

1 / 66

MMLU

91.80

4 / 66

MMLU Pro

26 / 132

MMLU Pro

83.70

43 / 132

GPQA Diamond

80.10

81 / 187

GPQA Diamond

74.90

101 / 187

HLE

15.90

131 / 170

常识问答

共 1 项评测

评测名称 / 模式

得分

排名/总数

SimpleQA

93.40

4 / 47

编程与软件工程

共 3 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

74.80

41 / 123

LiveCodeBench

56.40

79 / 123

SWE-bench Verified

73 / 111

数学推理

共 4 项评测

评测名称 / 模式

得分

排名/总数

AIME 2024

93.10

7 / 62

AIME 2024

66.30

40 / 62

AIME2025

88.40

43 / 107

AIME2025

49.80

88 / 107

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

Terminal-Bench

31.30

19 / 35

常识推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

Simple Bench

常规模式

40 / 63

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

DeepSeek-V3.1

发布机构

DeepSeek-AI

查看发布机构详情

DeepSeek-V3.1

模型解读

DeepSeek V3.1 是 DeepSeek V3 的升级版本，于2025年8月19日发布，知识日期截止到2024年8月，比DeepSeek V3-0324版本多一个月（DeepSeek V3-0324的知识为2024年7月）。

2025年8月19日，官方群里发布更新，官网的DeepSeek更新到DeepSeek V3.1版本，但没有公布更多详情。根据官网的消息，DeepSeekV3.1在复杂数学计算、逻辑推理和代码生成方面进行了优化，提高了准确性和推理深度，尤其是在多步推理任务上表现更好。此外，虽然都是128K输入，但V3.1 在长文本理解和信息提取方面更加精准，减少了冗余回答。

关于DeepSeek-V3.1详细介绍参考： https://www.datalearner.com/blog/1051755634545683

DeepSeek-V3.1

常见问题

DeepSeek-V3.1 是什么模型？

DeepSeek-V3.1 支持哪些输入和输出模态？

当前官方资料记录其支持文本输入，并生成文本输出。

DeepSeek-V3.1 的上下文窗口和最大输出是多少？

上下文窗口为 128K，最大输出为 8K。未公开或无法确认的规格不做推测。

DeepSeek-V3.1 适合哪些任务？

根据已收录的官方能力标签，它适合推理大模型、多语言相关任务；实际效果应结合具体工作流验证。

DeepSeek-V3.1 是否提供 API，价格如何查看？

页面已收录 Fireworks AI 的 8 条定价规则。价格可能随地域、上下文档位、缓存和时间变化，应以页面价格表及官方计费页为准。

DeepSeek-V3.1 是否开源？

代码与模型权重按 MIT License 记录；使用前仍应核对官方许可原文。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送