OpenAI发布GPT-5.3-Codex

2026年2月5日,OpenAI发布GPT-5.3-Codex,称其为目前最强的代理式编码模型:把GPT-5.2-Codex的前沿编码能力与GPT-5.2的推理与专业知识合并到同一模型,并在Codex使用场景下提速25%。OpenAI表示,该模型面向需要研究、工具调用与复杂执行的长周期任务,工作过程中可被用户实时介入与引导而不丢失上下文。

官方披露的基准结果显示,GPT-5.3-Codex在SWE-Bench Pro(Public)为56.8%,Terminal-Bench 2.0为77.3%,OSWorld-Verified为64.7%,GDPval(胜或平)为70.9%;同时给出网络安全CTF 77.6%与SWE-Lancer IC Diamond 81.4%等指标。OpenAI注明文中评测均以xhigh推理力度运行。除代码生成与评审外,覆盖调试、部署、监控、撰写PRD、文案编辑、用户研究、测试与指标分析等软件生命周期工作,并可产出演示文稿、表格等知识型交付物。

OpenAI称GPT-5.3-Codex是其“首个在自身开发中发挥关键作用”的模型:团队在训练与上线阶段使用早期版本进行训练调试、部署管理、评测诊断,并在发布期间用于定位上下文渲染缺陷、缓存命中率问题与动态扩缩GPU集群等工程任务。

在安全与网络安全方面,OpenAI表示该模型在其Preparedness Framework下首次被归类为网络安全领域“High capability”,并首次被直接训练用于识别软件漏洞;同时强调尚无确凿证据表明其可端到端自动化网络攻击,但将以更强的安全训练、自动监控、受信访问与执法管线等措施进行防护,并启动“Trusted Access for Cyber”试点,扩展Aardvark私测与开源代码库扫描合作,承诺提供1000万美元API额度支持防御性研究。

供给方面,GPT-5.3-Codex已面向付费ChatGPT计划开放,可在Codex app、CLI、IDE扩展和网页版使用;OpenAI称正在“安全地”推进API可用性。Codex更新日志同步给出切换方式(如CLI使用codex --model gpt-5.3-codex),并提示API key工作流在支持完全上线前继续使用gpt-5.2-codex;OpenAI还披露该模型在NVIDIA GB200 NVL72系统上训练与服务。


OpenAI
 
 
Back to Top