返回热力追踪
关键Model Opensource

英伟达开源5500亿参数旗舰大模型Nemotron 3 Ultra 登陆AWS SageMaker

英伟达发布面向长程自主智能体任务的5500亿参数开源大模型Nemotron 3 Ultra,该模型推理速度较同级别模型提升5倍,推理成本降低30%,现已支持在亚马逊SageMaker JumpStart一键部署

编辑视角

该模型是当前美国本土性能最强的开源大模型,专为智能体任务优化,开源后将推动开源智能体生态发展,对AI从业者了解前沿进展有较高参考价值

深度解读

本次事件的主旨是英伟达联合Nemotron联盟推出专为自主智能体打造的旗舰级开源大模型Nemotron 3 Ultra,并完成了在亚马逊AWS SageMaker JumpStart的适配上线。现有多信源交叉验证,确认该模型为5500亿参数混合MoE架构,支持100万token上下文窗口,推理性能相比同级别模型提升5倍,成本降低30%,已在多家主流平台上线,已有厂商宣布接入。边界方面:目前仅公开第三方评测得分,未放出完整可复现的评测数据,部署该大模型需要极高算力门槛,暂无国内落地的公开案例。后续可观察该模型的开源生态完善情况与实际落地效果

核心要点
  • 英伟达开源5500亿参数MoE架构旗舰大模型Nemotron 3 Ultra
  • 模型专为长程自主智能体任务优化,支持百万token上下文
  • 推理速度较同级别模型提升5倍,推理成本降低30%
  • 现已登陆AWS SageMaker JumpStart,支持一键部署
英伟达开源5500亿参数旗舰大模型Nemotron 3 Ultra 登陆AWS SageMaker | Aione