Skip to main content

LoopDNS资讯播报

LoopDNS 综合资讯---简洁,及时,快速,准确


频道: @DNSPODT

电报讨论组: @LoopDNS

撤稿流程: https://t.me/loopdns/107752
  1. 财富杂志:Anthropic正在开发并已对早期用户测试一款新AI模型,该模型被认为性能上有 “飞跃式提升”。此前一次数据泄露曝光了该模型存在,以及未发布博客草稿和计划中的欧洲CEO峰会细节。博客草稿提到新模型Claude Mythos和Capybara,似指同一底层模型,Capybara比之前的Opus模型更大、更智能但也更昂贵,在软件编码等测试中得分更高。

    同时,泄露文件指出新模型会带来前所未有的网络安全风险,因它在网络能力上远超其他模型,或被黑客用于大规模网络攻击,公司计划先向网络防御组织发布。

    source
  2. 研究发现:利用文言文可百分之百成功“越狱”主流大模型

    一项被 ICLR 2026 收录的论文揭示了当前大模型在安全对齐机制上存在的系统性盲区。研究表明,通过使用文言文进行指令,可以100%成功绕过六大主流大模型的安全限制,获取如制造炸弹、入侵企业网络等危险信息。
    该研究将“越狱”策略拆解为角色身份、隐喻映射等八个维度,并利用果蝇优化算法(FOA)寻找最优组合,实现了极高效率的自动化攻击。 研究者指出,大模型在预训练阶段已能理解古典语言并与现代危险概念建立语义映射,但安全对齐策略却主要集中在现代通用语言上。因此,古典语言成了一种能激活模型底层能力又避开表层安全机制的“高维加密字典”。这一发现凸显了在模型内部建立更深层次跨语种意图对齐的必要性。

    来源:arivx
  3. 网传霍尔木兹海峡收费方案:美以阵营船只150-200万美元/艘,普通国家15-20万美元/艘,友好国家(中、俄、印等)免费。支付方式优先人民币,接受加密货币、实物结算。