OpenAI 最近为其 Responses API 引入了持久 WebSocket 连接,通过优化基础设施来减轻涉及多轮工具调用的代理 AI 应用中的累积延迟。
这一进展在 GPT-5.3-Codex-Spark 公告中被列为核心工程特性。该模型与 Cerebras 合作开发,作为轻量级实时变体,其生成速度超过每秒 1,000 个 token。通过将持久连接与内部 API 优化相结合,OpenAI 报告往返开销减少了 80%,每 token 成本降低了 30%,首字时间(TTFT)提升了 50%。
这一转变解决了复杂代理循环中传统 HTTP 请求的结构性低效问题。在涉及数十轮规划和工具执行交互的工作流中,重复握手和完整上下文重传的成本会迅速累积。维持单个持久连接允许客户端传输增量输入并引用先前状态,以利用服务器端内存缓存。这种方法避免了完整历史记录的冗余传输,减轻了网络和计算负担。
OpenAI
Cline
这一进展在 GPT-5.3-Codex-Spark 公告中被列为核心工程特性。该模型与 Cerebras 合作开发,作为轻量级实时变体,其生成速度超过每秒 1,000 个 token。通过将持久连接与内部 API 优化相结合,OpenAI 报告往返开销减少了 80%,每 token 成本降低了 30%,首字时间(TTFT)提升了 50%。
这一转变解决了复杂代理循环中传统 HTTP 请求的结构性低效问题。在涉及数十轮规划和工具执行交互的工作流中,重复握手和完整上下文重传的成本会迅速累积。维持单个持久连接允许客户端传输增量输入并引用先前状态,以利用服务器端内存缓存。这种方法避免了完整历史记录的冗余传输,减轻了网络和计算负担。
OpenAI
Cline
关于hynix hbm4传言与rubin
1)HBM4的进展是三星快于海力士,快于美光。三星2月份应该已经基本走完了认证流程,因此三星HBM4会率先出货并被启用。
2)hynix的base die交给TSMC,必然会有ECO的turn around,这种ECO层面微调不会占用太多时间,也不会是本质问题。
3)当前是2月底,rubin计划6月底开始逐步出货rubin,4个月时间足够hynix在base die上完成调整。
4)Nv今年开始进入多产品线,CPX采用HBM3/3e,LPU基于SRAM,rubin采用HBM4,增量看点更多,也使得产业稳定性更强。对于HBM4上面的小波动,不会带来本质影响。
1)HBM4的进展是三星快于海力士,快于美光。三星2月份应该已经基本走完了认证流程,因此三星HBM4会率先出货并被启用。
2)hynix的base die交给TSMC,必然会有ECO的turn around,这种ECO层面微调不会占用太多时间,也不会是本质问题。
3)当前是2月底,rubin计划6月底开始逐步出货rubin,4个月时间足够hynix在base die上完成调整。
4)Nv今年开始进入多产品线,CPX采用HBM3/3e,LPU基于SRAM,rubin采用HBM4,增量看点更多,也使得产业稳定性更强。对于HBM4上面的小波动,不会带来本质影响。
传言称, SK 海力士的 HBM4 出现问题,12 纳米 base die 需修改光罩,大规模供货可能延迟一个季度以上。相关供应链的出货将受到影响。
twitter.com/Arronwei3n/status/2026220539073753523
Citrini与Alap Shah发布了一项基于2028年视角的经济思想实验,探讨AI大规模普及可能引发的系统性危机。推演指出,AI替代白领工作虽短期内推高企业利润,但会致使消费者购买力出现结构性受损。
报告模型显示,该趋势或将触发负反馈循环,引发消费萎缩、软件企业收入下滑与私募信贷违约,最终危及住房抵押贷款市场。此项宏观推演旨在呼吁市场与决策者提前防范相关风险。
来源:Citrini Research
商务部:将20家日本实体列入关注名单
商务部公告,根据《中华人民共和国出口管制法》和《中华人民共和国两用物项出口管制条例》等法律法规有关规定,决定将斯巴鲁株式会社等无法核实两用物项最终用户、最终用途的20家日本实体列入关注名单。
来源:证券时报
商务部公告,根据《中华人民共和国出口管制法》和《中华人民共和国两用物项出口管制条例》等法律法规有关规定,决定将斯巴鲁株式会社等无法核实两用物项最终用户、最终用途的20家日本实体列入关注名单。
来源:证券时报
多地接连发布中小学学位预警
根据教育部的信息,小学学龄人口已在2023年达峰,而初中学龄人口高峰则预计在2026年到来。相较往年学位预警主要集中在小学阶段,今年学位预警开始呈现向初中阶段传导的特征。
来源:财新网
根据教育部的信息,小学学龄人口已在2023年达峰,而初中学龄人口高峰则预计在2026年到来。相较往年学位预警主要集中在小学阶段,今年学位预警开始呈现向初中阶段传导的特征。
来源:财新网
玻璃纤维短缺加剧 制造商将掀起第二轮涨价潮
据报道,供应商和业内人士预计,由于成本上升和供应紧张,玻璃纤维制造商将掀起第二轮涨价潮。计划中的月度调价幅度为10%至15%,若按当前计划推进,到年底价格可能翻倍。
据报道,供应商和业内人士预计,由于成本上升和供应紧张,玻璃纤维制造商将掀起第二轮涨价潮。计划中的月度调价幅度为10%至15%,若按当前计划推进,到年底价格可能翻倍。
Anthropic:我们已确认三家 AI 实验室——深度求索、月之暗面与 MiniMax——为提升自身模型性能,通过非法手段系统性提取 Claude 能力。这些实验室通过约 2.4 万个欺诈账户与 Claude 进行了超 1600 万次违规交互,严重违反我方服务条款及区域访问限制。
这些实验室使用了一种名为"蒸馏"的技术,即通过训练一个能力较弱的模型来模仿更强模型的输出。蒸馏是一种广泛使用且合法的训练方法。例如,前沿人工智能实验室通常会蒸馏自己的模型,为客户创建更小、更便宜的版本。但蒸馏也可用于非法目的:竞争对手可以利用该技术,以独立开发所需时间和成本的一小部分,从其他实验室获取强大能力。
这类攻击行动的强度和复杂程度正在不断提升。采取行动的窗口期很短,且威胁已超越任何单一公司或地区。应对这一挑战需要行业参与者、政策制定者和全球人工智能社区之间迅速、协调一致的行动。
Detecting and preventing distillation attacks
这些实验室使用了一种名为"蒸馏"的技术,即通过训练一个能力较弱的模型来模仿更强模型的输出。蒸馏是一种广泛使用且合法的训练方法。例如,前沿人工智能实验室通常会蒸馏自己的模型,为客户创建更小、更便宜的版本。但蒸馏也可用于非法目的:竞争对手可以利用该技术,以独立开发所需时间和成本的一小部分,从其他实验室获取强大能力。
这类攻击行动的强度和复杂程度正在不断提升。采取行动的窗口期很短,且威胁已超越任何单一公司或地区。应对这一挑战需要行业参与者、政策制定者和全球人工智能社区之间迅速、协调一致的行动。
Detecting and preventing distillation attacks
中国政经事实ChinaFacts
春节消费/出行数据来看,中国消费K型特征愈发明显。
出行强劲但人均消费继续下滑;三四线消费主导的电影票房偏弱,但一线城市文旅消费较强;免税消费增速创几年新高;白酒中茅台量价齐升但五粮液以下几乎都偏弱,部分中档动销下滑20-30%。
春节消费/出行数据来看,中国消费K型特征愈发明显。
出行强劲但人均消费继续下滑;三四线消费主导的电影票房偏弱,但一线城市文旅消费较强;免税消费增速创几年新高;白酒中茅台量价齐升但五粮液以下几乎都偏弱,部分中档动销下滑20-30%。
Jukan
KIS:Rubin CPX从GDDR7转向采用HBM技术
根据我们的渠道调查,Rubin CPX预计将采用HBM技术,而非GDDR7。此前,英伟达曾宣布计划将预填充操作(AI推理工作负载中对内存需求相对较低的部分)转移至配备GDDR7的独立GPU Rubin CPX上。这项设计策略可能基于以下判断:预填充操作对内存带宽的要求相对较低,因此无需采用HBM技术。因此,Rubin CPX的内存规格最终改为HBM这一事实意义重大。这表明,即使是预填充操作在实际生产环境中也需要较高的内存带宽和容量,而GDDR7最终不足以提供足够的性能效率。由于英伟达尚未正式宣布这一规格变更,我们尚未将Rubin CPX相关的HBM需求纳入我们的HBM模型。如果这一潜在需求得以实现,HBM供应短缺预计将进一步加剧。
KIS:Rubin CPX从GDDR7转向采用HBM技术
根据我们的渠道调查,Rubin CPX预计将采用HBM技术,而非GDDR7。此前,英伟达曾宣布计划将预填充操作(AI推理工作负载中对内存需求相对较低的部分)转移至配备GDDR7的独立GPU Rubin CPX上。这项设计策略可能基于以下判断:预填充操作对内存带宽的要求相对较低,因此无需采用HBM技术。因此,Rubin CPX的内存规格最终改为HBM这一事实意义重大。这表明,即使是预填充操作在实际生产环境中也需要较高的内存带宽和容量,而GDDR7最终不足以提供足够的性能效率。由于英伟达尚未正式宣布这一规格变更,我们尚未将Rubin CPX相关的HBM需求纳入我们的HBM模型。如果这一潜在需求得以实现,HBM供应短缺预计将进一步加剧。
玉渊谭天:美方新关税可能面临司法诉讼
美国最新加征的所谓“临时关税”,援引的是很久没有使用的《1974年贸易法》第122条,理由是“从根本上解决美国国际收支失衡”,尤其是解决美国存在巨额贸易逆差的问题。但第122条的适用前提是,美国国际收支出现根本性的问题。法律上对此的判断依据并不是单一的货物贸易逆差,而是包括资本流动、商品和服务贸易在内的整体国际收支状况。从这个角度看,美国这项关税生效之后,很可能像此前一样面临被起诉的风险。
来源:财联社
美国最新加征的所谓“临时关税”,援引的是很久没有使用的《1974年贸易法》第122条,理由是“从根本上解决美国国际收支失衡”,尤其是解决美国存在巨额贸易逆差的问题。但第122条的适用前提是,美国国际收支出现根本性的问题。法律上对此的判断依据并不是单一的货物贸易逆差,而是包括资本流动、商品和服务贸易在内的整体国际收支状况。从这个角度看,美国这项关税生效之后,很可能像此前一样面临被起诉的风险。
来源:财联社
谷歌副总裁警告称“大模型封装”与“模型聚合”将死
生成式人工智能的蓬勃发展几乎每分钟都能催生一家初创公司,但随着热潮逐渐消退,曾经炙手可热的大模型应用封装和AI聚合平台如今更像是前车之鉴。负责谷歌全球创业团队副总裁的 Darren Mowry 表示,那些依赖这些概念的创业公司已经亮起“发动机故障灯”。
大模型封装器本质上是指那些将现有的大型语言模型与产品或用户体验层进行封装,以解决特定问题的创业公司,例如使用特定提示词引导模型完成业务需求。“如果你真的只是依赖后端模型来完成所有工作,并且几乎是简单地贴牌生产,那么业界已经对这种做法失去了耐心。” 而随着模型提供商自身也开始拓展企业级功能和多模型策略,AI聚合商也面临着利润压力,这可能会使中间商失去市场。
生成式人工智能的蓬勃发展几乎每分钟都能催生一家初创公司,但随着热潮逐渐消退,曾经炙手可热的大模型应用封装和AI聚合平台如今更像是前车之鉴。负责谷歌全球创业团队副总裁的 Darren Mowry 表示,那些依赖这些概念的创业公司已经亮起“发动机故障灯”。
大模型封装器本质上是指那些将现有的大型语言模型与产品或用户体验层进行封装,以解决特定问题的创业公司,例如使用特定提示词引导模型完成业务需求。“如果你真的只是依赖后端模型来完成所有工作,并且几乎是简单地贴牌生产,那么业界已经对这种做法失去了耐心。” 而随着模型提供商自身也开始拓展企业级功能和多模型策略,AI聚合商也面临着利润压力,这可能会使中间商失去市场。
消息人士称,谷歌正洽谈向初创公司 FluidStack 投资约 1 亿美元。
消息人士还称,谷歌希望提升 FluidStack 的增长潜力,并考虑将 TPU 业务重组为独立部门。
此外,消息人士还透露,谷歌正寻求利用其雄厚的财力推动 TPU 的更广泛应用,并正在探索如何利用其财力与英伟达展开竞争。
消息人士还称,谷歌希望提升 FluidStack 的增长潜力,并考虑将 TPU 业务重组为独立部门。
此外,消息人士还透露,谷歌正寻求利用其雄厚的财力推动 TPU 的更广泛应用,并正在探索如何利用其财力与英伟达展开竞争。
特朗普称最高法院关税裁决可耻
据美国媒体报道,在美国联邦最高法院今天(2月20日)裁决“特朗普政府依据美国《国际紧急经济权力法》实施的相关大规模关税措施缺乏明确法律授权”后,特朗普在白宫举行全美州长早餐会期间,称这一裁决“可耻”。
报道称,特朗普表示,他已“考虑好备选方案”,以应对最高法院裁决带来的影响。目前,白宫尚未公布具体替代措施细节。此前,美国政府官员曾表示,一旦依据美国《国际紧急经济权力法》的关税被判违法,将考虑通过其他贸易法律恢复相关关税。
来源:每经网
据美国媒体报道,在美国联邦最高法院今天(2月20日)裁决“特朗普政府依据美国《国际紧急经济权力法》实施的相关大规模关税措施缺乏明确法律授权”后,特朗普在白宫举行全美州长早餐会期间,称这一裁决“可耻”。
报道称,特朗普表示,他已“考虑好备选方案”,以应对最高法院裁决带来的影响。目前,白宫尚未公布具体替代措施细节。此前,美国政府官员曾表示,一旦依据美国《国际紧急经济权力法》的关税被判违法,将考虑通过其他贸易法律恢复相关关税。
来源:每经网
在印度人工智能影响力峰会上,OpenAI与Anthropic两家美国人工智能公司的CEO在合影时刻意没有握手,这一场景引发热议。
当地时间周四,印度总理莫迪在峰会上发表讲话,并与科技企业高管们合影。在现场掌声中,莫迪主动举起了萨姆·奥尔特曼以及谷歌公司CEO孙达尔·皮柴的手,其他人也纷纷效仿。
但与萨姆·奥尔特曼与相邻的Anthropic CEO达里奥·阿莫代伊没有握手,而是各自举起拳头示意,显得特别突兀。
两人拒绝牵手的照片迅速在社交媒体上传开。阿莫代伊和奥尔特曼多次在公开场合表示 “看不上” 对方的商业模式和理念。近期,双方最近还围绕“是否在AI产品中加入广告”问题隔空交锋。
来源:彭博社
特朗普考虑采取初步有限打击以迫使伊朗重返核协议
初步打击若获批准可能在数日内实施,目标将是少数军事或政府设施。若伊朗仍拒绝遵守特朗普要求其终止核浓缩项目的指令,美国将发动针对政权设施的大规模打击行动——可能旨在推翻德黑兰政权。
来源:华尔街日报
初步打击若获批准可能在数日内实施,目标将是少数军事或政府设施。若伊朗仍拒绝遵守特朗普要求其终止核浓缩项目的指令,美国将发动针对政权设施的大规模打击行动——可能旨在推翻德黑兰政权。
来源:华尔街日报