NVIDIA 发布开源模型 Nemotron 3 Ultra,面向长时运行 AI Agent
NVIDIA 在 GTC Taipei 期间发布 Nemotron 3 Ultra,将其定位为面向长时运行 AI Agent 的开放模型,主要服务于代码、研究和企业工作流等复杂任务场景。该模型采用混合专家架构,参数规模为 550B,NVIDIA 称其在同级开放前沿模型中可实现最高 5 倍推理速度,并将复杂 Agent 任务成本降低最多 30%。
Nemotron 3 Ultra 属于 Nemotron 3 系列中的高端版本,面向最高推理精度和复杂 Agent 任务。NVIDIA 开发者页面显示,Nemotron 3 系列基于混合 Mamba-Transformer MoE 架构,支持 100 万 token 上下文,用于高吞吐、长上下文和多步骤 Agent 应用。
NVIDIA 表示,Nemotron 3 Ultra 已针对 Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands 和 OpenCode 等 Agent 平台及框架进行后训练,目标是降低企业在部署长期运行代理时的推理成本和延迟。
来源
NVIDIA 在 GTC Taipei 期间发布 Nemotron 3 Ultra,将其定位为面向长时运行 AI Agent 的开放模型,主要服务于代码、研究和企业工作流等复杂任务场景。该模型采用混合专家架构,参数规模为 550B,NVIDIA 称其在同级开放前沿模型中可实现最高 5 倍推理速度,并将复杂 Agent 任务成本降低最多 30%。
Nemotron 3 Ultra 属于 Nemotron 3 系列中的高端版本,面向最高推理精度和复杂 Agent 任务。NVIDIA 开发者页面显示,Nemotron 3 系列基于混合 Mamba-Transformer MoE 架构,支持 100 万 token 上下文,用于高吞吐、长上下文和多步骤 Agent 应用。
NVIDIA 表示,Nemotron 3 Ultra 已针对 Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands 和 OpenCode 等 Agent 平台及框架进行后训练,目标是降低企业在部署长期运行代理时的推理成本和延迟。
来源