英国海事贸易行动办公室(UKMTO):两艘油轮在伊拉克领海、巴士拉以南5海里处遭不明飞行物袭击。
其中一艘受影响船舶的连络官证实,袭击引发了船上火灾。目前全体船员已安全撤离。
针对第二艘受影响船舶的身份核查仍在进行中。
目前尚未收到环境污染报告。
其中一艘受影响船舶的连络官证实,袭击引发了船上火灾。目前全体船员已安全撤离。
针对第二艘受影响船舶的身份核查仍在进行中。
目前尚未收到环境污染报告。
Anthropic 近期为其 AI 开发工具 Claude Code 推出“代码评审(Code Review)”功能,该功能采用多 Agent 协作模式,旨在实现对代码逻辑、安全漏洞及潜在 Bug 的深度自动化审核。
在开发者提交 Pull Request(PR)时,Claude Code 会启动多个并行的 AI 智能体,分别从代码规范、逻辑冲突和安全风险等不同维度进行专项检查。通过智能体之间的相互验证,系统能够有效过滤误报,并根据问题的严重程度进行分级标注。
Anthropic内部测试结果显示,实施该功能后,包含实质性评审意见的PR比例从16%暴涨至54%。在1000行以上的大型PR中,84%的代码被检测出问题,平均每份PR包含7.5个Bug。即便是不易引起重视的小型PR(少于50行),也有31%被发现潜在风险。工程师对评审结果的认可度超过99%,误报率低于1%。
从公告披露的信息看,这笔收购主要指向企业在部署 AI 代理过程中的评测、安全与合规需求。OpenAI 认为,随着 AI 系统越来越多地进入真实业务流程,企业需要更系统的方法来测试代理行为、在部署前识别风险,并持续保留审计与治理所需的记录。
OpenAI 称,Promptfoo 目前由 Ian Webster 和 Michael D’Angelo 领导,相关工具已被超过四分之一的《财富》500 强企业采用,同时其开源 CLI 和库已被广泛用于 LLM 应用的评测与红队测试。双方后续将继续维护这一开源项目,并把部分能力推进到 Frontier 的企业功能体系中。
按照 OpenAI 的说法,整合后的重点将包括三部分:把自动化安全测试和红队能力原生纳入平台,用于发现提示注入、越狱、数据泄露、工具滥用和越权行为等风险;把安全与评测更早地嵌入开发流程;以及补充报告、追踪和治理支持,以满足不断上升的合规要求。公告同时指出,这笔收购仍需满足惯常成交条件,尚未最终完成。