OpenAI 发布 GPT-5.1-Codex-Max:面向长时程代码代理的新模型

OpenAI 于 2025 年 11 月 19 日正式推出 GPT-5.1-Codex-Max,这是其新一代面向软件工程与长时程代理任务的编码模型。该模型基于更新后的基础推理模型,在多项真实工程任务与前沿基准中较 GPT-5.1-Codex 取得明显提升。

根据官方信息,GPT-5.1-Codex-Max 支持跨多组上下文窗口的“压缩(compaction)”机制,可在单一任务中保持数百万 token 的连贯工作能力,支持项目级重构、长时间调试与多小时自动循环执行。内部测试中,该模型可在无人干预下连续工作超过 24 小时。

在 SWE-bench Verified、SWE-Lancer 等编码评估中,模型整体准确率有所提升,并在相同推理等级下减少约 30% 的思考 token 消耗。模型首次加入 Windows 环境训练,并强化 Codex CLI 协作能力。

OpenAI
 
 
Back to Top