DeepSeek V4.1
模型参数
1.6万亿
上下文长度
1M
中文支持
支持
推理能力
DeepSeek V4.1 是由 DeepSeek-AI 发布的 AI 模型,发布时间为 2026-06-01,定位为 推理大模型,参数规模约为 1.6万亿,上下文长度为 1M,采用 MIT License 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
DeepSeek-V4.1
模型基本信息
推理过程
支持
思考模式
不支持思考模式
上下文长度
1M tokens
最大输出长度
375K tokens
模型类型
推理大模型
输入/输出模态
文本、图像、音频 → 文本
发布时间
2026-06-01
模型文件大小
暂无数据
MoE架构
是
总参数 / 激活参数
1.6万亿 / 不涉及
知识截止
2025-05
DeepSeek-V4.1
开源和体验地址
DeepSeek-V4.1
官方介绍与博客
官方论文
DataLearnerAI博客
暂无介绍博客
DeepSeek-V4.1
API接口信息
接口速度
3/5
暂无公开的 API 定价信息。
DeepSeek-V4.1
评测结果
当前尚无可展示的评测数据。
和其他模型对比
暂时没有为该模型整理的相关对比页面。
想自定义其他组合?打开对比工具
DeepSeek-V4.1
发布机构
DeepSeek-AI
查看发布机构详情 DeepSeek V4.1
模型解读
根据The Information及多家媒体于2026年5月8日的报道,DeepSeek计划在2026年6月发布其V4模型的迭代版本——V4.1。需要特别注明的是,截至当前,DeepSeek官方尚未正式发布此模型。以下信息均基于相关报道和其前代V4的公开技术规格整理。
V4.1预计将作为V4的升级版,核心聚焦于增强企业级应用能力和多模态输入处理。其背后强大的V4架构已在2026年4月24日以预览版形式发布,是一个拥有1.6万亿参数的混合专家(MoE)大语言模型。据称,V4.1计划新增对图像和音频内容的输入理解功能,但输出形式仍将限制为文本。
此外,V4.1被报道将引入对企业级工具的更完善支持,并深度优化对模型上下文协议(MCP)的适配,以帮助AI模型更无缝地与其他软件系统对接,从而在智能体(Agent)和工具调用场景中展现更强能力。作为技术基石的V4模型,则以其百万token的超长上下文窗口、DSA2稀疏注意力机制、Hyper-Connections残差连接和FP4+FP8混合精度训练等先进技术而闻名业界。该系列模型优化后可在华为昇腾AI处理器上运行,并在各类基准测试中展现出极高的性价比。
V4.1预计将作为V4的升级版,核心聚焦于增强企业级应用能力和多模态输入处理。其背后强大的V4架构已在2026年4月24日以预览版形式发布,是一个拥有1.6万亿参数的混合专家(MoE)大语言模型。据称,V4.1计划新增对图像和音频内容的输入理解功能,但输出形式仍将限制为文本。
此外,V4.1被报道将引入对企业级工具的更完善支持,并深度优化对模型上下文协议(MCP)的适配,以帮助AI模型更无缝地与其他软件系统对接,从而在智能体(Agent)和工具调用场景中展现更强能力。作为技术基石的V4模型,则以其百万token的超长上下文窗口、DSA2稀疏注意力机制、Hyper-Connections残差连接和FP4+FP8混合精度训练等先进技术而闻名业界。该系列模型优化后可在华为昇腾AI处理器上运行,并在各类基准测试中展现出极高的性价比。
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
