Anthropic 发布 Claude 基础设施故障事后报告

Anthropic 公布了一份详细技术报告,回顾 8 月至 9 月初间影响 Claude 响应质量的三处基础设施漏洞。公司强调,这些问题与用户量、服务器负载或时间无关,完全由底层技术错误引发。

第一,Sonnet 4 出现上下文窗口路由错误,短上下文请求被误送往长上下文服务器,8 月 31 日高峰时段影响达 16%。第二,TPU 端配置失误导致概率分布异常,部分英文回复夹入泰文、中文字符或出现代码语法错误。第三,XLA:TPU 编译器的近似 top-k 算法存在潜在缺陷,在特定条件下返回错误结果,影响 Haiku 3.5 及部分 Sonnet 4、Opus 3。

Anthropic 承认,现有评估与监控体系未能及时捕捉异常,增加了诊断难度。为避免类似事件重演,公司将引入更敏感的质量评估、在生产环境持续运行检测,并开发更快的调试工具,同时继续依赖用户反馈作为补充信号。

同时该公司表明: 直白来说:我们从不会因为需求量、时间或服务器负载而降低模型质量。用户报告的问题完全是由基础设施漏洞引起的。
原文:
To state it plainly: We never reduce model quality due to demand, time of day, or server load. The problems our users reported were due to infrastructure bugs alone.


来源: anthropic blog
X
 
 
Back to Top