DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
页面导航
大模型列表DeepSeek-V4.1
DE

DeepSeek-V4.1

传闻推理大模型

DeepSeek V4.1

发布时间: 2026-06-01知识截止: 2025-056
在线体验GitHubHugging FaceCompare
模型参数
16000亿
上下文长度
1M
中文支持
支持
推理能力

DeepSeek V4.1 是由 DeepSeek-AI 发布的 AI 模型,发布时间为 2026-06-01,定位为 推理大模型,参数规模约为 16000.0B,上下文长度为 1M,采用 MIT License 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

DeepSeek-V4.1

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
1M tokens
最大输出长度
384000 tokens
模型类型
推理大模型
发布时间
2026-06-01
模型文件大小
暂无数据
MoE架构
是
总参数 / 激活参数
16000 亿 / 暂无数据
知识截止
2025-05
DeepSeek-V4.1

开源和体验地址

代码开源状态
MIT License
预训练权重开源
MIT License- 免费商用授权
GitHub 源码
https://github.com/deepseek-ai
Hugging Face
https://huggingface.co/deepseek-ai
在线体验
暂无在线体验地址
DeepSeek-V4.1

官方介绍与博客

官方论文
DeepSeek官方API文档
DataLearnerAI博客
暂无介绍博客
DeepSeek-V4.1

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本0.170.46
缓存计费Cache
模态输入 Cache输出 Cache
文本0.01--
DeepSeek-V4.1

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

DeepSeek-V4.1

发布机构

DeepSeek-AI
DeepSeek-AI
查看发布机构详情
DeepSeek V4.1

模型解读

根据The Information及多家媒体于2026年5月8日的报道,DeepSeek计划在2026年6月发布其V4模型的迭代版本——V4.1。需要特别注明的是,截至当前,DeepSeek官方尚未正式发布此模型。以下信息均基于相关报道和其前代V4的公开技术规格整理。

V4.1预计将作为V4的升级版,核心聚焦于增强企业级应用能力和多模态输入处理。其背后强大的V4架构已在2026年4月24日以预览版形式发布,是一个拥有1.6万亿参数的混合专家(MoE)大语言模型。据称,V4.1计划新增对图像和音频内容的输入理解功能,但输出形式仍将限制为文本。

此外,V4.1被报道将引入对企业级工具的更完善支持,并深度优化对模型上下文协议(MCP)的适配,以帮助AI模型更无缝地与其他软件系统对接,从而在智能体(Agent)和工具调用场景中展现更强能力。作为技术基石的V4模型,则以其百万token的超长上下文窗口、DSA2稀疏注意力机制、Hyper-Connections残差连接和FP4+FP8混合精度训练等先进技术而闻名业界。该系列模型优化后可在华为昇腾AI处理器上运行,并在各类基准测试中展现出极高的性价比。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码