关键Model Opensource2026-06-04 21:32:14

英伟达发布5500亿参数开源混合专家模型优化长周期AI智能体

这是英伟达联合Nemotron联盟推出的面向长期运行AI智能体的开源大模型，为5500亿参数混合专家架构。相比同级别开源模型，推理速度最高提升5倍，成本最高降30%，已适配多款主流智能体框架，获多家科技企业生态支持

编辑视角

该模型针对AI Agent核心痛点优化，是大厂布局企业级Agent生态的关键动作，对AI从业者把握行业方向、企业部署Agent有重要参考价值

深度解读

本次英伟达发布的Nemotron 3 Ultra，瞄准长周期运行AI Agent Token膨胀、成本高、目标漂移的痛点，推出5500亿参数混合专家架构开源大模型，官方数据显示其相比同级别主流开源模型，推理速度最高提升5倍，使用成本最高降低30%。目前该模型已适配Hermes Agent、LangChain Deep Agents等多款主流Agent开发框架，同时英伟达联合微软、Canonical、红帽等企业布局企业级Agent运行生态，已在CrowdStrike、Palantir的企业平台落地应用。边界方面，现有信息仅来自官方发布与媒体转载，尚无第三方独立评测验证官方给出的性能数据，检索信息中未明确模型开源的授权协议、权重获取方式，普通开发者能否免费获取使用尚不清晰。后续需要关注第三方评测结果、开源开放细节以及更多企业落地案例

核心要点

英伟达联合Nemotron联盟发布5500亿参数开源MoE模型Nemotron 3 Ultra
该模型专为长周期AI Agent优化，官方称推理提效5倍成本降30%
已适配多款主流Agent框架，多家科技企业参与企业级生态建设

英伟达发布5500亿参数开源混合专家模型 优化长周期AI智能体

英伟达发布5500亿参数开源混合专家模型优化长周期AI智能体