关键Model Opensource2026-06-05 01:32:21

英伟达开源5500亿参数旗舰大模型Nemotron 3 Ultra 登陆AWS SageMaker

英伟达发布面向长程自主智能体任务的5500亿参数开源大模型Nemotron 3 Ultra，该模型推理速度较同级别模型提升5倍，推理成本降低30%，现已支持在亚马逊SageMaker JumpStart一键部署

编辑视角

该模型是当前美国本土性能最强的开源大模型，专为智能体任务优化，开源后将推动开源智能体生态发展，对AI从业者了解前沿进展有较高参考价值

深度解读

本次事件的主旨是英伟达联合Nemotron联盟推出专为自主智能体打造的旗舰级开源大模型Nemotron 3 Ultra，并完成了在亚马逊AWS SageMaker JumpStart的适配上线。现有多信源交叉验证，确认该模型为5500亿参数混合MoE架构，支持100万token上下文窗口，推理性能相比同级别模型提升5倍，成本降低30%，已在多家主流平台上线，已有厂商宣布接入。边界方面：目前仅公开第三方评测得分，未放出完整可复现的评测数据，部署该大模型需要极高算力门槛，暂无国内落地的公开案例。后续可观察该模型的开源生态完善情况与实际落地效果

核心要点

英伟达开源5500亿参数MoE架构旗舰大模型Nemotron 3 Ultra
模型专为长程自主智能体任务优化，支持百万token上下文
推理速度较同级别模型提升5倍，推理成本降低30%
现已登陆AWS SageMaker JumpStart，支持一键部署

查看原始来源：AWS