关键Model Opensource2026-06-05 07:31:01

英伟达发布开源550B参数Nemotron 3 Ultra，专为长时AI智能体设计

该模型是英伟达Nemotron 3家族最大开源模型，采用MoE混合Mamba-Transformer架构，总参数550B，单次推理仅激活55B，支持1M token上下文，推理速度较同类模型提升最高6倍，成本降最高30%。

编辑视角

瞄准长时AI智能体推理慢、成本高的核心痛点，头部厂商开源大参数模型，将推动开源Agent生态发展，对企业部署有重要参考价值。

深度解读

本次发布的核心是英伟达推出专为长时运行AI智能体打造的开源大参数模型，解决多轮Agent推理token增长带来的成本高、速度慢的行业痛点。多方信源确认了模型架构、参数、性能提升数据，模型已开源权重，适配多款主流Agent开发框架，已有头部企业落地应用。边界方面：目前第三方独立性能验证尚未公开，实际大规模商用落地案例较少，不同信源对开源协议表述不一致，需后续确认授权范围。后续观察点包括第三方性能测试结果、企业实际部署成本、更多场景的落地效果。

核心要点

英伟达发布总参数量550B的开源MoE大模型Nemotron 3 Ultra
专为长时运行AI智能体设计，推理速度提升最高6倍成本降最高30%
支持1M token上下文，已适配多款主流Agent开发框架开源可获取