NVIDIA 发布开源模型 Nemotron 3 Ultra，面向长时运行 AI AgentNVIDIA 在 GTC Taipei 期间发布 Nemotron 3 Ultra，将其定位为面向长时运行 AI Agent 的开放模型，主要服务于代码、研究和企业工作流等复杂任务场景

2 days ago

NVIDIA 发布开源模型 Nemotron 3 Ultra，面向长时运行 AI Agent

NVIDIA 在 GTC Taipei 期间发布 Nemotron 3 Ultra，将其定位为面向长时运行 AI Agent 的开放模型，主要服务于代码、研究和企业工作流等复杂任务场景。该模型采用混合专家架构，参数规模为 550B，NVIDIA 称其在同级开放前沿模型中可实现最高 5 倍推理速度，并将复杂 Agent 任务成本降低最多 30%。

Nemotron 3 Ultra 属于 Nemotron 3 系列中的高端版本，面向最高推理精度和复杂 Agent 任务。NVIDIA 开发者页面显示，Nemotron 3 系列基于混合 Mamba-Transformer MoE 架构，支持 100 万 token 上下文，用于高吞吐、长上下文和多步骤 Agent 应用。

NVIDIA 表示，Nemotron 3 Ultra 已针对 Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands 和 OpenCode 等 Agent 平台及框架进行后训练，目标是降低企业在部署长期运行代理时的推理成本和延迟。

来源