DE

DeepSeek-V4.1

传闻推理大模型DeepSeek VDeepSeek V4.1

DeepSeek V4.1

发布时间: 2026-06-01更新于: 2026-06-15 07:18:21.805知识截止: 2025-057,997

在线体验GitHub Hugging Face Compare

模型参数

1.6万亿

上下文长度

1M

中文支持

支持

推理能力

DeepSeek V4.1 是由 DeepSeek-AI 发布的 AI 模型，发布时间为 2026-06-01，定位为推理大模型，参数规模约为 1.6万亿，上下文长度为 1M，采用 MIT License 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

DeepSeek-V4.1

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

1M tokens

最大输出长度

375K tokens

模型类型

推理大模型

输入/输出模态

文本、图像、音频 → 文本

发布时间

2026-06-01

模型文件大小

暂无数据

MoE架构

是

总参数 / 激活参数

1.6万亿 / 不涉及

知识截止

2025-05

DeepSeek-V4.1

开源和体验地址

代码开源状态

预训练权重开源

MIT License- 免费商用授权

GitHub 源码

https://github.com/deepseek-ai

Hugging Face

https://huggingface.co/deepseek-ai

在线体验

暂无在线体验地址

DeepSeek-V4.1

官方介绍与博客

官方论文

DeepSeek官方API文档

DataLearnerAI博客

暂无介绍博客

DeepSeek-V4.1

API接口信息

接口速度

3/5

暂无公开的 API 定价信息。

DeepSeek-V4.1

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

DeepSeek-V4.1

发布机构

DeepSeek-AI

查看发布机构详情

DeepSeek V4.1

模型解读

根据The Information及多家媒体于2026年5月8日的报道，DeepSeek计划在2026年6月发布其V4模型的迭代版本——V4.1。需要特别注明的是，截至当前，DeepSeek官方尚未正式发布此模型。以下信息均基于相关报道和其前代V4的公开技术规格整理。

V4.1预计将作为V4的升级版，核心聚焦于增强企业级应用能力和多模态输入处理。其背后强大的V4架构已在2026年4月24日以预览版形式发布，是一个拥有1.6万亿参数的混合专家（MoE）大语言模型。据称，V4.1计划新增对图像和音频内容的输入理解功能，但输出形式仍将限制为文本。

此外，V4.1被报道将引入对企业级工具的更完善支持，并深度优化对模型上下文协议（MCP）的适配，以帮助AI模型更无缝地与其他软件系统对接，从而在智能体（Agent）和工具调用场景中展现更强能力。作为技术基石的V4模型，则以其百万token的超长上下文窗口、DSA2稀疏注意力机制、Hyper-Connections残差连接和FP4+FP8混合精度训练等先进技术而闻名业界。该系列模型优化后可在华为昇腾AI处理器上运行，并在各类基准测试中展现出极高的性价比。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码