NE

Nemotron 3 Ultra

推理大模型

NVIDIA Nemotron 3 Ultra 550B-A55B

发布时间: 2026-06-04知识截止: 2026-050
模型参数
5500亿
上下文长度
1M
中文支持
支持
推理能力

NVIDIA 于 2026 年 6 月 4 日发布的 Nemotron 3 Ultra,550B 总参数、55B 激活参数,采用 LatentMoE / Mamba-2 / Attention 混合架构,支持 1M 上下文和可开关 reasoning。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Nemotron 3 Ultra

模型基本信息

推理过程
支持
思考模式
思考模式 (默认)常规模式
上下文长度
1M tokens
最大输出长度
暂无数据
模型类型
推理大模型
输入/输出模态
文本 → 文本
发布时间
2026-06-04
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
5500亿 / 550亿
知识截止
2026-05
Nemotron 3 Ultra

开源和体验地址

代码开源状态
免费商用授权
预训练权重开源
免费商用授权
Nemotron 3 Ultra

官方介绍与博客

Nemotron 3 Ultra

API接口信息

接口速度
4/5
暂无公开的 API 定价信息。
Nemotron 3 Ultra

评测结果

Nemotron 3 Ultra 当前已收录的代表性评测结果包括 LongBench v2(4 / 11,得分 61.90)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式

长上下文能力

共 1 项评测
评测名称 / 模式
得分
排名/总数
LongBench v2
常规模式
61.90
4 / 11

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Nemotron 3 Ultra

发布机构

NVIDIA Nemotron 3 Ultra 550B-A55B

模型解读

Nemotron 3 Ultra 是 NVIDIA 于 2026 年 6 月 4 日发布的 Nemotron 3 系列旗舰开放模型。NVIDIA 研究页将其描述为 550B 总参数、55B 激活参数的 MoE 模型,是 Nemotron 3 家族的最终和最高规格版本。


架构与规格

NVIDIA 和 Hugging Face 模型卡显示,Nemotron 3 Ultra 采用 LatentMoE、Mamba-2、MoE 与 Attention 混合架构,并加入 Multi-Token Prediction 层以提升生成效率。模型上下文长度最高 1M tokens,支持 reasoning budget 控制;HF 模型卡标注 BF16 版本总参数 550B、激活参数 55B,并列出英文、法文、西班牙文、意大利文、德文、日文、印地语、韩文、巴西葡萄牙文和中文等语言支持。


开放与许可

NVIDIA 发布了预训练、后训练和量化 checkpoint,以及用于训练的数据集和模型 recipe。HF 模型卡标注许可证为 OpenMDW-1.1,并说明模型可用于商业和非商业场景;DataLearner 许可证目录暂无 OpenMDW 专项条目,因此本条目按“免费商用授权”收录。


评测收录

BenchLM 的 LongBench v2 leaderboard 在 2026 年 6 月 18 日更新中收录 Nemotron 3 Ultra,成绩为 61.9%。本次将该成绩写入 DataLearner 的 LongBench v2 常规无工具模式。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码