Nemotron 3 Ultra
推理大模型NVIDIA Nemotron 3 Ultra 550B-A55B
NVIDIA 于 2026 年 6 月 4 日发布的 Nemotron 3 Ultra,550B 总参数、55B 激活参数,采用 LatentMoE / Mamba-2 / Attention 混合架构,支持 1M 上下文和可开关 reasoning。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
模型基本信息
开源和体验地址
官方介绍与博客
API接口信息
评测结果
Nemotron 3 Ultra 当前已收录的代表性评测结果包括 LongBench v2(4 / 11,得分 61.90)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
和其他模型对比
暂时没有为该模型整理的相关对比页面。
想自定义其他组合?打开对比工具
发布机构
模型解读
Nemotron 3 Ultra 是 NVIDIA 于 2026 年 6 月 4 日发布的 Nemotron 3 系列旗舰开放模型。NVIDIA 研究页将其描述为 550B 总参数、55B 激活参数的 MoE 模型,是 Nemotron 3 家族的最终和最高规格版本。
架构与规格
NVIDIA 和 Hugging Face 模型卡显示,Nemotron 3 Ultra 采用 LatentMoE、Mamba-2、MoE 与 Attention 混合架构,并加入 Multi-Token Prediction 层以提升生成效率。模型上下文长度最高 1M tokens,支持 reasoning budget 控制;HF 模型卡标注 BF16 版本总参数 550B、激活参数 55B,并列出英文、法文、西班牙文、意大利文、德文、日文、印地语、韩文、巴西葡萄牙文和中文等语言支持。
开放与许可
NVIDIA 发布了预训练、后训练和量化 checkpoint,以及用于训练的数据集和模型 recipe。HF 模型卡标注许可证为 OpenMDW-1.1,并说明模型可用于商业和非商业场景;DataLearner 许可证目录暂无 OpenMDW 专项条目,因此本条目按“免费商用授权”收录。
评测收录
BenchLM 的 LongBench v2 leaderboard 在 2026 年 6 月 18 日更新中收录 Nemotron 3 Ultra,成绩为 61.9%。本次将该成绩写入 DataLearner 的 LongBench v2 常规无工具模式。
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
