Kimi K2.6 发布
Moonshot AI 已于 2026 年 4 月 20 日发布 Kimi K2.6。官方将其定位为开源、原生多模态代理模型,现已上线 Kimi.com、Kimi App、API 和 Kimi Code;Hugging Face 模型卡显示,该模型采用 MoE 架构,总参数 1T、激活参数 32B,上下文长度 256K,许可证标注为 modified-MIT。
K2.6 的优势主要集中在工具增强任务和部分编码基准。在 HLE-Full with tools、DeepSearchQA 和 SWE-Bench Pro 上,它分别达到 54.0、92.5 和 58.6,高于表中 GPT-5.4、Claude Opus 4.6 和 K2.5 的对应成绩;但它并未在所有项目上领先,例如 Terminal-Bench 2.0 仍低于 Gemini 3.1 Pro,纯推理 HLE-Full 以及多项视觉测试也落后于 GPT-5.4 或 Gemini 3.1 Pro。
重点强调长时程编码、从前端到轻量全栈的生成能力,以及 Agent Swarm 的扩展能力。按照其展示案例,K2.6 可在一次任务中执行 4000 次以上工具调用、持续运行 12 小时以上,并把 Agent Swarm 扩展到 300 个子代理和 4000 个协调步骤。
Kimi Blog
Moonshot AI 已于 2026 年 4 月 20 日发布 Kimi K2.6。官方将其定位为开源、原生多模态代理模型,现已上线 Kimi.com、Kimi App、API 和 Kimi Code;Hugging Face 模型卡显示,该模型采用 MoE 架构,总参数 1T、激活参数 32B,上下文长度 256K,许可证标注为 modified-MIT。
K2.6 的优势主要集中在工具增强任务和部分编码基准。在 HLE-Full with tools、DeepSearchQA 和 SWE-Bench Pro 上,它分别达到 54.0、92.5 和 58.6,高于表中 GPT-5.4、Claude Opus 4.6 和 K2.5 的对应成绩;但它并未在所有项目上领先,例如 Terminal-Bench 2.0 仍低于 Gemini 3.1 Pro,纯推理 HLE-Full 以及多项视觉测试也落后于 GPT-5.4 或 Gemini 3.1 Pro。
重点强调长时程编码、从前端到轻量全栈的生成能力,以及 Agent Swarm 的扩展能力。按照其展示案例,K2.6 可在一次任务中执行 4000 次以上工具调用、持续运行 12 小时以上,并把 Agent Swarm 扩展到 300 个子代理和 4000 个协调步骤。
Kimi Blog