智谱补齐长链路 Agent 的高速模型位 GLM-5-TurboGLM-5-Turbo 重点强化了工具调用、复杂指令拆解、定时与持续性任务，以及高吞吐长链路执行能力

01:05 · Mar 16, 2026 · Mon

智谱补齐长链路 Agent 的高速模型位 GLM-5-Turbo

GLM-5-Turbo 重点强化了工具调用、复杂指令拆解、定时与持续性任务，以及高吞吐长链路执行能力。官方文档同时给出的规格是 200K 上下文、128K 最大输出，仅支持文本输入输出，并支持 Function Call、结构化输出、上下文缓存和 MCP 接入。

GLM-5-Turbo 已进入官方价格表，输入价格为每百万 tokens 1.2 美元，缓存输入 0.24 美元，输出 4.0 美元，缓存存储限时免费。套餐侧则显示 Max 已支持该模型，Pro 预计在 3 月底支持，Lite 预计在 4 月内支持。按这一节奏看，智谱正在把 GLM-5 系列进一步拆分为旗舰推理与高吞吐 Agent 执行两个更清晰的产品层级。

z.ai