2026年2月5日,OpenAI发布GPT-5.3-Codex,称其为目前最强的代理式编码模型:把GPT-5.2-Codex的前沿编码能力与GPT-5.2的推理与专业知识合并到同一模型,并在Codex使用场景下提速25%。OpenAI表示,该模型面向需要研究、工具调用与复杂执行的长周期任务,工作过程中可被用户实时介入与引导而不丢失上下文。
官方披露的基准结果显示,GPT-5.3-Codex在SWE-Bench Pro(Public)为56.8%,Terminal-Bench 2.0为77.3%,OSWorld-Verified为64.7%,GDPval(胜或平)为70.9%;同时给出网络安全CTF 77.6%与SWE-Lancer IC Diamond 81.4%等指标。OpenAI注明文中评测均以xhigh推理力度运行。除代码生成与评审外,覆盖调试、部署、监控、撰写PRD、文案编辑、用户研究、测试与指标分析等软件生命周期工作,并可产出演示文稿、表格等知识型交付物。
OpenAI