Anthropic 发布 Claude 基础设施故障事后报告Anthropic 公布了一份详细技术报告，回顾 8 月至 9 月初间影响 Claude 响应质量的三处基础设施漏洞

23:50 · Sep 17, 2025 · Wed

Anthropic 发布 Claude 基础设施故障事后报告

Anthropic 公布了一份详细技术报告，回顾 8 月至 9 月初间影响 Claude 响应质量的三处基础设施漏洞。公司强调，这些问题与用户量、服务器负载或时间无关，完全由底层技术错误引发。

第一，Sonnet 4 出现上下文窗口路由错误，短上下文请求被误送往长上下文服务器，8 月 31 日高峰时段影响达 16%。第二，TPU 端配置失误导致概率分布异常，部分英文回复夹入泰文、中文字符或出现代码语法错误。第三，XLA:TPU 编译器的近似 top-k 算法存在潜在缺陷，在特定条件下返回错误结果，影响 Haiku 3.5 及部分 Sonnet 4、Opus 3。

Anthropic 承认，现有评估与监控体系未能及时捕捉异常，增加了诊断难度。为避免类似事件重演，公司将引入更敏感的质量评估、在生产环境持续运行检测，并开发更快的调试工具，同时继续依赖用户反馈作为补充信号。

同时该公司表明: 直白来说：我们从不会因为需求量、时间或服务器负载而降低模型质量。用户报告的问题完全是由基础设施漏洞引起的。
原文:

To state it plainly: We never reduce model quality due to demand, time of day, or server load. The problems our users reported were due to infrastructure bugs alone.

来源: anthropic blog
X