LoopDNS资讯播报
-
- Jukan
KIS:Rubin CPX从GDDR7转向采用HBM技术
根据我们的渠道调查,Rubin CPX预计将采用HBM技术,而非GDDR7。此前,英伟达曾宣布计划将预填充操作(AI推理工作负载中对内存需求相对较低的部分)转移至配备GDDR7的独立GPU Rubin CPX上。这项设计策略可能基于以下判断:预填充操作对内存带宽的要求相对较低,因此无需采用HBM技术。因此,Rubin CPX的内存规格最终改为HBM这一事实意义重大。这表明,即使是预填充操作在实际生产环境中也需要较高的内存带宽和容量,而GDDR7最终不足以提供足够的性能效率。由于英伟达尚未正式宣布这一规格变更,我们尚未将Rubin CPX相关的HBM需求纳入我们的HBM模型。如果这一潜在需求得以实现,HBM供应短缺预计将进一步加剧。 - 玉渊谭天:美方新关税可能面临司法诉讼
美国最新加征的所谓“临时关税”,援引的是很久没有使用的《1974年贸易法》第122条,理由是“从根本上解决美国国际收支失衡”,尤其是解决美国存在巨额贸易逆差的问题。但第122条的适用前提是,美国国际收支出现根本性的问题。法律上对此的判断依据并不是单一的货物贸易逆差,而是包括资本流动、商品和服务贸易在内的整体国际收支状况。从这个角度看,美国这项关税生效之后,很可能像此前一样面临被起诉的风险。
来源:财联社 - 谷歌副总裁警告称“大模型封装”与“模型聚合”将死
生成式人工智能的蓬勃发展几乎每分钟都能催生一家初创公司,但随着热潮逐渐消退,曾经炙手可热的大模型应用封装和AI聚合平台如今更像是前车之鉴。负责谷歌全球创业团队副总裁的 Darren Mowry 表示,那些依赖这些概念的创业公司已经亮起“发动机故障灯”。
大模型封装器本质上是指那些将现有的大型语言模型与产品或用户体验层进行封装,以解决特定问题的创业公司,例如使用特定提示词引导模型完成业务需求。“如果你真的只是依赖后端模型来完成所有工作,并且几乎是简单地贴牌生产,那么业界已经对这种做法失去了耐心。” 而随着模型提供商自身也开始拓展企业级功能和多模型策略,AI聚合商也面临着利润压力,这可能会使中间商失去市场。 - 消息人士称,谷歌正洽谈向初创公司 FluidStack 投资约 1 亿美元。
消息人士还称,谷歌希望提升 FluidStack 的增长潜力,并考虑将 TPU 业务重组为独立部门。
此外,消息人士还透露,谷歌正寻求利用其雄厚的财力推动 TPU 的更广泛应用,并正在探索如何利用其财力与英伟达展开竞争。 - 特朗普称最高法院关税裁决可耻
据美国媒体报道,在美国联邦最高法院今天(2月20日)裁决“特朗普政府依据美国《国际紧急经济权力法》实施的相关大规模关税措施缺乏明确法律授权”后,特朗普在白宫举行全美州长早餐会期间,称这一裁决“可耻”。
报道称,特朗普表示,他已“考虑好备选方案”,以应对最高法院裁决带来的影响。目前,白宫尚未公布具体替代措施细节。此前,美国政府官员曾表示,一旦依据美国《国际紧急经济权力法》的关税被判违法,将考虑通过其他贸易法律恢复相关关税。
来源:每经网 -
-
- 印度AI峰会合影时两大AI掌门人拒绝握手
在印度人工智能影响力峰会上,OpenAI与Anthropic两家美国人工智能公司的CEO在合影时刻意没有握手,这一场景引发热议。
当地时间周四,印度总理莫迪在峰会上发表讲话,并与科技企业高管们合影。在现场掌声中,莫迪主动举起了萨姆·奥尔特曼以及谷歌公司CEO孙达尔·皮柴的手,其他人也纷纷效仿。
但与萨姆·奥尔特曼与相邻的Anthropic CEO达里奥·阿莫代伊没有握手,而是各自举起拳头示意,显得特别突兀。
两人拒绝牵手的照片迅速在社交媒体上传开。阿莫代伊和奥尔特曼多次在公开场合表示 “看不上” 对方的商业模式和理念。近期,双方最近还围绕“是否在AI产品中加入广告”问题隔空交锋。
来源:彭博社 - 特朗普考虑采取初步有限打击以迫使伊朗重返核协议
初步打击若获批准可能在数日内实施,目标将是少数军事或政府设施。若伊朗仍拒绝遵守特朗普要求其终止核浓缩项目的指令,美国将发动针对政权设施的大规模打击行动——可能旨在推翻德黑兰政权。
来源:华尔街日报 - Anthropic 发布新规:禁止将 Claude 个人订阅凭证用于第三方开发工具
近日,Anthropic更新了 Claude Code 的法律与合规页面,在“Authentication and credential use”部分进一步明确 OAuth 与 API Key 的使用边界,并强化对违规使用情形的约束说明。
更新内容指出,Claude Code 通过 OAuth 令牌或 API Key 与 Anthropic 服务器进行身份验证,但两种方式适用场景不同。使用 Free、Pro、Max 计划时所获得的 OAuth 认证,仅限于 Claude Code 与 Claude.ai 使用。将此类 OAuth 令牌用于其他产品、工具或服务,包括 Agent SDK,将被视为违反《Consumer Terms of Service》。
针对开发者,Anthropic 明确表示,构建与 Claude 能力交互的产品或服务时,应通过 Claude Console 或支持的云服务提供商获取 API Key 进行认证。公司不允许第三方开发者提供 Claude.ai 登录,或代表用户通过 Free、Pro、Max 计划凭证转发请求。
Anthropic 保留在不事先通知的情况下采取措施执行相关限制的权利。
Claude -
- 英国拒绝了美国使用迪戈加西亚岛(Diego Garcia)和皇家空军费福尔德基地(RAF Fairford)对伊朗实施打击的请求。此举促使特朗普总统撤回了对“毛里求斯查戈斯群岛协议”的支持,其核心诱因在于双方对国际法及军事合作边界的考量存在分歧。英国官员强调,任何对英国基地的使用都必须符合本国法律及国际法准则。 -The Times.
- Claude 现已通过Figma MCP服务器与 Figma 实现无缝集成,用户可将代码原型直接推送至 Figma 平台进行版本探索。只需安装 Figma 插件,并指示 claude 将网页应用页面发送至 Figma 即可。
更多详情请参阅相关文档。
code.claude.com/docs/en/mcp -
通用人工智能(AGI)的追求不仅需要缩放模型参数,还需要从根本上重新思考智能效率和自主改进的架构。虽然之前的版本如 GLM-4.5 证明了在混合专家(MoE)框架下统一代理、推理和代码(ARC)能力的优势,但大语言模型(LLM)从被动知识库向主动问题解决者的转型,暴露了计算成本和现实适应性(特别是在软件工程领域)的关键瓶颈。
arxiv
为了应对这些挑战,我们推出了 GLM-5,这是一款旨在填补高性能推理与运算效率之间鸿沟的旗舰模型。其架构的核心是 DeepSeek 稀疏注意力(DSA),它允许根据 token 的重要性动态分配注意力资源。这一创新显著降低了训练和推理过程中的计算开销,且未损害长文本理解能力。因此,我们成功将模型规模扩展至 744B 参数(40B 激活),并将训练预算增加到 28.5T token。
我们的后训练流水线超越了标准的监督微调,实施了序列强化学习(RL)框架。我们开发了一种异步强化学习基础设施,通过将生成与训练解耦,最大限度地提高 GPU 利用率并消除同步瓶颈。此外,新型异步代理 RL 算法使 GLM-5 能够从复杂的长时程交互中学习,显著提升了其在动态环境中的规划和自我纠错能力。
评估结果表明,GLM-5 在各大主流基准测试中均达到了顶尖水平,在 Artificial Analysis 智能指数 v4.0 中获得 50 分。在真实的工程任务中,该模型展示了前所未有的熟练度,特别是在大仓库检索方面超越了以往的基准。这些进展表明,有效的代理工程更多地依赖于战略性的迭代推理,而非简单的代码生成。 - OpenAI 开源 Codex App Server
Codex App Server 面向泛客户端的协议层,Codex 开发者文档允许你使用 Codex app-server 通过 Codex 用来驱动泛客户端(例如 OpenCode)的接口,目标是把 Codex 深度嵌入第三方产品,覆盖认证、会话历史、审批与流式代理事件等能力。并提供“Sign in with ChatGPT”登录流程
OpenAI 明确将 Codex App Server 标注为开源部件,并标注其源码位于 openai/codex 仓库的 codex-rs/app-server 路径。
“支持 ChatGPT 登录” 对应的是其账户认证接口:也就是说除 API key 模式外,app-server 支持由 Codex 托管的 ChatGPT OAuth 模式(chatgpt)。客户端可通过 account/login/start 获取 authUrl,在浏览器完成登录后由本地回调接收结果,并通过 account/login/completed 与 account/updated 等通知获知登录成功/失败与当前 authMode;接口还提供读取 ChatGPT 额度窗口(rate limits)的方法与通知。
Codex 的认证文档补充了两类登录方式的定位:ChatGPT 登录用于订阅访问,API key 用于按量计费;CLI/IDE 会缓存凭据(文件或系统凭据库),并在无浏览器/网络限制场景下提供设备码登录(beta)等替代方案。
OpenAI developers - DeepMind Lyria 3在应用内生成30秒曲目
2026年2月18日,Google在官方博客宣布,Gemini 应用开始以 Beta 形式上线音乐生成功能,调用 Google DeepMind 的 Lyria 3 模型,用户可用文字描述或上传图片生成 30 秒音乐片段。2026年2月18日,Google在官方博客宣布,Gemini 应用开始以 Beta 形式上线音乐生成功能,调用 Google DeepMind 的 Lyria 3 模型,用户可用文字描述或上传图片生成 30 秒音乐片段。
Google表示,Gemini 生成的 30 秒曲目会附带由 “Nano Banana” 生成的封面图,便于下载或分享。Google称该功能面向 18 岁及以上用户开放,首批支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语;桌面端当日上线,移动端将在接下来数日内逐步推送;Google AI Plus/Pro/Ultra 订阅用户将获得更高的使用额度。
Google称 Gemini 中生成的音乐会嵌入 SynthID 不可感知水印,并将 Gemini 内的 SynthID 验证能力扩展到音频,用户可上传文件询问是否由 Google AI 生成或编辑;DeepMind 也在模型页提到其通过过滤与标注降低有害内容/歌词风险,并对生成曲目进行 SynthID 水印标记音乐生成功能定位为“原创表达”而非模仿现有艺人;若提示词点名特定艺人,将被视作广义灵感,并配套输出内容过滤与权利申诉渠道。
Google Blog - 【《扬声》对话王兴兴(精选)】 2016年,硕士毕业不久后的@宇树 王兴兴 成立宇树科技。这十年里,机器人行业日新月异、如火如荼,有人离场,有人破圈。本期《扬声》精选篇,对话宇树科技创始人王兴兴。#纪录片扬声
- 据两位直接知情人士透露,OpenAI 正在敲定来自投资者的初步承诺,此轮融资可能在包括本次投资在内的估值为8300亿美元的基础上筹集1000亿美元。
据两位人士称,软银预计将以300亿美元的投资作为领投方,该笔投资将在一年内分三期每期100亿美元分批投入。为OpenAI提供云服务的亚马逊可能出资多达500亿美元;其芯片被OpenAI的模型使用的英伟达可能出资高达300亿美元;长期合作伙伴微软可能出资数十亿美元。
该人士表示,这些投资可能满足公司目标的1000亿美元,这意味着来自风投基金和其他金融机构的额外投资有可能把这一轮融资推高超过该数字。然而,另一位知情人士表示,目前谈判仍在进行中,尚不清楚这些战略投资者是否会投资全部金额。
THE INFORMATION - Anthropic发布Claude Sonnet 4.6
Anthropic于2026年2月17日发布Claude Sonnet 4.6,并在编程、电脑操作、长上下文推理、代理规划、知识工作与设计等方面做了升级,同时提供1M token上下文窗口(beta)
Sonnet 4.6已在claude.ai与Claude Cowork面向Free与Pro计划设为默认模型;定价与Sonnet 4.5保持一致,起步为每百万token 3美元/15美元(输入/输出)。OSWorld-Verified展示Sonnet 4.6为72.5%,较Sonnet 4.5的61.4%上升;同时指出此类能力仍落后于最熟练的人类,但进步速度显著。Sonnet 4.6在SWE-bench Verified为79.6%,Terminal-Bench 2.0为59.1%,办公任务(GDPval-AA Elo)为1633,并在OSWorld-Verified达到72.5%。
anthropic