Z.ai 发布 GLM-5.2 权重,开源 753B 长上下文旗舰模型
Z.ai 已在 Hugging Face 发布 GLM-5.2 权重。官方集合目前包含 zai-org/GLM-5.2 与 zai-org/GLM-5.2-FP8 两个条目,分别对应基础版本和 FP8 版本;模型页显示许可证为 MIT,模型规模为 753B 参数。
GLM-5.2 定位为面向长周期任务的旗舰基础模型,核心特性是 100 万 token 上下文与最高 128K 输出。Z.ai 官方文档称,该模型面向项目级工程上下文、长期 Coding Agent 任务和跨模块调试场景优化,并支持流式输出、函数调用、上下文缓存、结构化输出和 MCP 集成。
从模型卡信息看,GLM-5.2 在架构上引入 IndexShare,用于在稀疏注意力层之间复用索引器,官方称在 1M 上下文长度下可将每 token FLOPs 降低 2.9 倍;同时改进 MTP 层以提升 speculative decoding 的接受长度。
Blog
Z.ai 已在 Hugging Face 发布 GLM-5.2 权重。官方集合目前包含 zai-org/GLM-5.2 与 zai-org/GLM-5.2-FP8 两个条目,分别对应基础版本和 FP8 版本;模型页显示许可证为 MIT,模型规模为 753B 参数。
GLM-5.2 定位为面向长周期任务的旗舰基础模型,核心特性是 100 万 token 上下文与最高 128K 输出。Z.ai 官方文档称,该模型面向项目级工程上下文、长期 Coding Agent 任务和跨模块调试场景优化,并支持流式输出、函数调用、上下文缓存、结构化输出和 MCP 集成。
从模型卡信息看,GLM-5.2 在架构上引入 IndexShare,用于在稀疏注意力层之间复用索引器,官方称在 1M 上下文长度下可将每 token FLOPs 降低 2.9 倍;同时改进 MTP 层以提升 speculative decoding 的接受长度。
Blog