智谱补齐长链路 Agent 的高速模型位 GLM-5-Turbo
GLM-5-Turbo 重点强化了工具调用、复杂指令拆解、定时与持续性任务,以及高吞吐长链路执行能力。官方文档同时给出的规格是 200K 上下文、128K 最大输出,仅支持文本输入输出,并支持 Function Call、结构化输出、上下文缓存和 MCP 接入。
GLM-5-Turbo 已进入官方价格表,输入价格为每百万 tokens 1.2 美元,缓存输入 0.24 美元,输出 4.0 美元,缓存存储限时免费。套餐侧则显示 Max 已支持该模型,Pro 预计在 3 月底支持,Lite 预计在 4 月内支持。按这一节奏看,智谱正在把 GLM-5 系列进一步拆分为旗舰推理与高吞吐 Agent 执行两个更清晰的产品层级。
z.ai
GLM-5-Turbo 重点强化了工具调用、复杂指令拆解、定时与持续性任务,以及高吞吐长链路执行能力。官方文档同时给出的规格是 200K 上下文、128K 最大输出,仅支持文本输入输出,并支持 Function Call、结构化输出、上下文缓存和 MCP 接入。
GLM-5-Turbo 已进入官方价格表,输入价格为每百万 tokens 1.2 美元,缓存输入 0.24 美元,输出 4.0 美元,缓存存储限时免费。套餐侧则显示 Max 已支持该模型,Pro 预计在 3 月底支持,Lite 预计在 4 月内支持。按这一节奏看,智谱正在把 GLM-5 系列进一步拆分为旗舰推理与高吞吐 Agent 执行两个更清晰的产品层级。
z.ai