DE

DeepSeek-V4.1

传闻推理大模型DeepSeek VDeepSeek V4.1

DeepSeek V4.1

发布时间: 2026-06-01更新于: 2026-06-15 07:18:21.805知识截止: 2025-057,993
模型参数
1.6万亿
上下文长度
1M
中文支持
支持
推理能力

DeepSeek V4.1 是由 DeepSeek-AI 发布的 AI 模型,发布时间为 2026-06-01,定位为 推理大模型,参数规模约为 1.6万亿,上下文长度为 1M,采用 MIT License 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

DeepSeek-V4.1

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
1M tokens
最大输出长度
375K tokens
模型类型
推理大模型
输入/输出模态
文本、图像、音频 → 文本
发布时间
2026-06-01
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
1.6万亿 / 不涉及
知识截止
2025-05
DeepSeek-V4.1

开源和体验地址

代码开源状态
预训练权重开源
MIT License- 免费商用授权
在线体验
暂无在线体验地址
DeepSeek-V4.1

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
DeepSeek-V4.1

API接口信息

接口速度
3/5
暂无公开的 API 定价信息。
DeepSeek-V4.1

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

DeepSeek-V4.1

发布机构

DeepSeek V4.1

模型解读

根据The Information及多家媒体于2026年5月8日的报道,DeepSeek计划在2026年6月发布其V4模型的迭代版本——V4.1。需要特别注明的是,截至当前,DeepSeek官方尚未正式发布此模型。以下信息均基于相关报道和其前代V4的公开技术规格整理。

V4.1预计将作为V4的升级版,核心聚焦于增强企业级应用能力和多模态输入处理。其背后强大的V4架构已在2026年4月24日以预览版形式发布,是一个拥有1.6万亿参数的混合专家(MoE)大语言模型。据称,V4.1计划新增对图像和音频内容的输入理解功能,但输出形式仍将限制为文本。

此外,V4.1被报道将引入对企业级工具的更完善支持,并深度优化对模型上下文协议(MCP)的适配,以帮助AI模型更无缝地与其他软件系统对接,从而在智能体(Agent)和工具调用场景中展现更强能力。作为技术基石的V4模型,则以其百万token的超长上下文窗口、DSA2稀疏注意力机制、Hyper-Connections残差连接和FP4+FP8混合精度训练等先进技术而闻名业界。该系列模型优化后可在华为昇腾AI处理器上运行,并在各类基准测试中展现出极高的性价比。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码