Claude Sonnet 4.5 发布:性能与安全双提升
Anthropic 于 9 月 30 日推出新一代模型 Claude Sonnet 4.5,并称其为“全球最强编码模型”。该版本在推理、数学和真实计算机使用任务上大幅提升,在 SWE-bench Verified 代码评测中达 77.2%,在 OSWorld 真实操作系统任务测试中达到 61.4%,领先同类模型。
此次更新还带来多项产品升级:
Claude Code 新增检查点功能、VS Code 原生插件和更完善的终端界面;
Claude API 增加上下文编辑和记忆工具,支持更复杂、更长时长的任务;
Claude 应用 支持代码执行与文件生成;
Claude Agent SDK 向开发者开放底层基础设施,用于构建 AI 代理。
在安全性上,Sonnet 4.5 作为 Anthropic 最“对齐”的前沿模型,显著减少了迎合、欺骗和越权等问题,并强化了防御提示注入攻击的能力。该模型在 AI Safety Level 3 (ASL-3) 框架下发布,内置 CBRN 风险过滤器。
价格保持与 Sonnet 4 相同,API 计费为 每百万 tokens $3(输入)/$15(输出)。Sonnet 4.5 现已面向所有开发者和用户开放。
来源:Anthropic 官方博客
Anthropic 于 9 月 30 日推出新一代模型 Claude Sonnet 4.5,并称其为“全球最强编码模型”。该版本在推理、数学和真实计算机使用任务上大幅提升,在 SWE-bench Verified 代码评测中达 77.2%,在 OSWorld 真实操作系统任务测试中达到 61.4%,领先同类模型。
此次更新还带来多项产品升级:
Claude Code 新增检查点功能、VS Code 原生插件和更完善的终端界面;
Claude API 增加上下文编辑和记忆工具,支持更复杂、更长时长的任务;
Claude 应用 支持代码执行与文件生成;
Claude Agent SDK 向开发者开放底层基础设施,用于构建 AI 代理。
在安全性上,Sonnet 4.5 作为 Anthropic 最“对齐”的前沿模型,显著减少了迎合、欺骗和越权等问题,并强化了防御提示注入攻击的能力。该模型在 AI Safety Level 3 (ASL-3) 框架下发布,内置 CBRN 风险过滤器。
价格保持与 Sonnet 4 相同,API 计费为 每百万 tokens $3(输入)/$15(输出)。Sonnet 4.5 现已面向所有开发者和用户开放。
来源:Anthropic 官方博客