返回热力追踪
关键Model Opensource

英伟达发布5500亿参数开源混合专家模型 优化长周期AI智能体

这是英伟达联合Nemotron联盟推出的面向长期运行AI智能体的开源大模型,为5500亿参数混合专家架构。相比同级别开源模型,推理速度最高提升5倍,成本最高降30%,已适配多款主流智能体框架,获多家科技企业生态支持

编辑视角

该模型针对AI Agent核心痛点优化,是大厂布局企业级Agent生态的关键动作,对AI从业者把握行业方向、企业部署Agent有重要参考价值

深度解读

本次英伟达发布的Nemotron 3 Ultra,瞄准长周期运行AI Agent Token膨胀、成本高、目标漂移的痛点,推出5500亿参数混合专家架构开源大模型,官方数据显示其相比同级别主流开源模型,推理速度最高提升5倍,使用成本最高降低30%。目前该模型已适配Hermes Agent、LangChain Deep Agents等多款主流Agent开发框架,同时英伟达联合微软、Canonical、红帽等企业布局企业级Agent运行生态,已在CrowdStrike、Palantir的企业平台落地应用。边界方面,现有信息仅来自官方发布与媒体转载,尚无第三方独立评测验证官方给出的性能数据,检索信息中未明确模型开源的授权协议、权重获取方式,普通开发者能否免费获取使用尚不清晰。后续需要关注第三方评测结果、开源开放细节以及更多企业落地案例

核心要点
  • 英伟达联合Nemotron联盟发布5500亿参数开源MoE模型Nemotron 3 Ultra
  • 该模型专为长周期AI Agent优化,官方称推理提效5倍成本降30%
  • 已适配多款主流Agent框架,多家科技企业参与企业级生态建设
延伸阅读
  • 英伟达官宣推出全球首款完全开放的全模态物理AI模型NVIDIA Cosmos 3同为英伟达2026年6月初发布的新型AI模型