OpenAI 发布 gpt-oss:首批开放权重推理模型,最高 120 B 参数
OpenAI 8 月 5 日官方博客宣布推出两款开放权重语言模型 gpt-oss-120b 与 gpt-oss-20b,并采用 Apache 2.0 许可,这是公司自 GPT-2 以来首次开放权重的大模型。
gpt-oss-120b 在核心推理基准上接近 o4-mini,同样支持单张 80 GB GPU 推理。
gpt-oss-20b 表现与 o3-mini 相当,仅需 16 GB 内存即可在本地或边缘设备运行。
模型针对 agentic 工作流优化,原生支持指令跟随、工具调用(如网络检索与 Python 执行)、可调“推理力度”,并开放 完整 chain-of-thought 便于调试与可信度评估。
支持全参数微调,开发者可按低/中/高推理策略权衡成本与延迟。
两款模型经过系统化安全训练与评估;OpenAI 还对恶意微调后的 gpt-oss-120b 进行 Preparedness Framework 压力测试,确认其未达到高风险能力级别。
相关方法接受外部专家审阅,被视为开放模型安全标准的新进展。