Vercel 开源 Chat SDK
Vercel 在 2026 年 2 月 23 日的更新公告中发布并开源了 Chat SDK(公测),定位为一套统一的 TypeScript 库,用同一份机器人逻辑覆盖多个聊天平台,包括 Slack、Microsoft Teams、Google Chat、Discord、GitHub 与 Linear。
代码仓库已在 GitHub 以 MIT 许可证发布,项目文档指向 chat-sdk.dev。
Vercel Blog
Vercel 在 2026 年 2 月 23 日的更新公告中发布并开源了 Chat SDK(公测),定位为一套统一的 TypeScript 库,用同一份机器人逻辑覆盖多个聊天平台,包括 Slack、Microsoft Teams、Google Chat、Discord、GitHub 与 Linear。
代码仓库已在 GitHub 以 MIT 许可证发布,项目文档指向 chat-sdk.dev。
Vercel Blog
美国商务部负责出口执法的助理部长David Peters透露,尽管特朗普决定允许向中国出口AI芯片,但英伟达近两个月来仍未向中国出售过任何H200芯片。
民主党众议员Sydney Kamlager-Dove问,有多少块H200芯片获准销往中国,David Peters回答,“据我了解,到目前为止,还没有。”
来源:外汇交易员
民主党众议员Sydney Kamlager-Dove问,有多少块H200芯片获准销往中国,David Peters回答,“据我了解,到目前为止,还没有。”
来源:外汇交易员
OpenAI 最近为其 Responses API 引入了持久 WebSocket 连接,通过优化基础设施来减轻涉及多轮工具调用的代理 AI 应用中的累积延迟。
这一进展在 GPT-5.3-Codex-Spark 公告中被列为核心工程特性。该模型与 Cerebras 合作开发,作为轻量级实时变体,其生成速度超过每秒 1,000 个 token。通过将持久连接与内部 API 优化相结合,OpenAI 报告往返开销减少了 80%,每 token 成本降低了 30%,首字时间(TTFT)提升了 50%。
这一转变解决了复杂代理循环中传统 HTTP 请求的结构性低效问题。在涉及数十轮规划和工具执行交互的工作流中,重复握手和完整上下文重传的成本会迅速累积。维持单个持久连接允许客户端传输增量输入并引用先前状态,以利用服务器端内存缓存。这种方法避免了完整历史记录的冗余传输,减轻了网络和计算负担。
OpenAI
Cline
这一进展在 GPT-5.3-Codex-Spark 公告中被列为核心工程特性。该模型与 Cerebras 合作开发,作为轻量级实时变体,其生成速度超过每秒 1,000 个 token。通过将持久连接与内部 API 优化相结合,OpenAI 报告往返开销减少了 80%,每 token 成本降低了 30%,首字时间(TTFT)提升了 50%。
这一转变解决了复杂代理循环中传统 HTTP 请求的结构性低效问题。在涉及数十轮规划和工具执行交互的工作流中,重复握手和完整上下文重传的成本会迅速累积。维持单个持久连接允许客户端传输增量输入并引用先前状态,以利用服务器端内存缓存。这种方法避免了完整历史记录的冗余传输,减轻了网络和计算负担。
OpenAI
Cline
关于hynix hbm4传言与rubin
1)HBM4的进展是三星快于海力士,快于美光。三星2月份应该已经基本走完了认证流程,因此三星HBM4会率先出货并被启用。
2)hynix的base die交给TSMC,必然会有ECO的turn around,这种ECO层面微调不会占用太多时间,也不会是本质问题。
3)当前是2月底,rubin计划6月底开始逐步出货rubin,4个月时间足够hynix在base die上完成调整。
4)Nv今年开始进入多产品线,CPX采用HBM3/3e,LPU基于SRAM,rubin采用HBM4,增量看点更多,也使得产业稳定性更强。对于HBM4上面的小波动,不会带来本质影响。
1)HBM4的进展是三星快于海力士,快于美光。三星2月份应该已经基本走完了认证流程,因此三星HBM4会率先出货并被启用。
2)hynix的base die交给TSMC,必然会有ECO的turn around,这种ECO层面微调不会占用太多时间,也不会是本质问题。
3)当前是2月底,rubin计划6月底开始逐步出货rubin,4个月时间足够hynix在base die上完成调整。
4)Nv今年开始进入多产品线,CPX采用HBM3/3e,LPU基于SRAM,rubin采用HBM4,增量看点更多,也使得产业稳定性更强。对于HBM4上面的小波动,不会带来本质影响。
传言称, SK 海力士的 HBM4 出现问题,12 纳米 base die 需修改光罩,大规模供货可能延迟一个季度以上。相关供应链的出货将受到影响。
twitter.com/Arronwei3n/status/2026220539073753523
Citrini与Alap Shah发布了一项基于2028年视角的经济思想实验,探讨AI大规模普及可能引发的系统性危机。推演指出,AI替代白领工作虽短期内推高企业利润,但会致使消费者购买力出现结构性受损。
报告模型显示,该趋势或将触发负反馈循环,引发消费萎缩、软件企业收入下滑与私募信贷违约,最终危及住房抵押贷款市场。此项宏观推演旨在呼吁市场与决策者提前防范相关风险。
来源:Citrini Research
商务部:将20家日本实体列入关注名单
商务部公告,根据《中华人民共和国出口管制法》和《中华人民共和国两用物项出口管制条例》等法律法规有关规定,决定将斯巴鲁株式会社等无法核实两用物项最终用户、最终用途的20家日本实体列入关注名单。
来源:证券时报
商务部公告,根据《中华人民共和国出口管制法》和《中华人民共和国两用物项出口管制条例》等法律法规有关规定,决定将斯巴鲁株式会社等无法核实两用物项最终用户、最终用途的20家日本实体列入关注名单。
来源:证券时报
多地接连发布中小学学位预警
根据教育部的信息,小学学龄人口已在2023年达峰,而初中学龄人口高峰则预计在2026年到来。相较往年学位预警主要集中在小学阶段,今年学位预警开始呈现向初中阶段传导的特征。
来源:财新网
根据教育部的信息,小学学龄人口已在2023年达峰,而初中学龄人口高峰则预计在2026年到来。相较往年学位预警主要集中在小学阶段,今年学位预警开始呈现向初中阶段传导的特征。
来源:财新网
玻璃纤维短缺加剧 制造商将掀起第二轮涨价潮
据报道,供应商和业内人士预计,由于成本上升和供应紧张,玻璃纤维制造商将掀起第二轮涨价潮。计划中的月度调价幅度为10%至15%,若按当前计划推进,到年底价格可能翻倍。
据报道,供应商和业内人士预计,由于成本上升和供应紧张,玻璃纤维制造商将掀起第二轮涨价潮。计划中的月度调价幅度为10%至15%,若按当前计划推进,到年底价格可能翻倍。
Anthropic:我们已确认三家 AI 实验室——深度求索、月之暗面与 MiniMax——为提升自身模型性能,通过非法手段系统性提取 Claude 能力。这些实验室通过约 2.4 万个欺诈账户与 Claude 进行了超 1600 万次违规交互,严重违反我方服务条款及区域访问限制。
这些实验室使用了一种名为"蒸馏"的技术,即通过训练一个能力较弱的模型来模仿更强模型的输出。蒸馏是一种广泛使用且合法的训练方法。例如,前沿人工智能实验室通常会蒸馏自己的模型,为客户创建更小、更便宜的版本。但蒸馏也可用于非法目的:竞争对手可以利用该技术,以独立开发所需时间和成本的一小部分,从其他实验室获取强大能力。
这类攻击行动的强度和复杂程度正在不断提升。采取行动的窗口期很短,且威胁已超越任何单一公司或地区。应对这一挑战需要行业参与者、政策制定者和全球人工智能社区之间迅速、协调一致的行动。
Detecting and preventing distillation attacks
这些实验室使用了一种名为"蒸馏"的技术,即通过训练一个能力较弱的模型来模仿更强模型的输出。蒸馏是一种广泛使用且合法的训练方法。例如,前沿人工智能实验室通常会蒸馏自己的模型,为客户创建更小、更便宜的版本。但蒸馏也可用于非法目的:竞争对手可以利用该技术,以独立开发所需时间和成本的一小部分,从其他实验室获取强大能力。
这类攻击行动的强度和复杂程度正在不断提升。采取行动的窗口期很短,且威胁已超越任何单一公司或地区。应对这一挑战需要行业参与者、政策制定者和全球人工智能社区之间迅速、协调一致的行动。
Detecting and preventing distillation attacks
中国政经事实ChinaFacts
春节消费/出行数据来看,中国消费K型特征愈发明显。
出行强劲但人均消费继续下滑;三四线消费主导的电影票房偏弱,但一线城市文旅消费较强;免税消费增速创几年新高;白酒中茅台量价齐升但五粮液以下几乎都偏弱,部分中档动销下滑20-30%。
春节消费/出行数据来看,中国消费K型特征愈发明显。
出行强劲但人均消费继续下滑;三四线消费主导的电影票房偏弱,但一线城市文旅消费较强;免税消费增速创几年新高;白酒中茅台量价齐升但五粮液以下几乎都偏弱,部分中档动销下滑20-30%。
Jukan
KIS:Rubin CPX从GDDR7转向采用HBM技术
根据我们的渠道调查,Rubin CPX预计将采用HBM技术,而非GDDR7。此前,英伟达曾宣布计划将预填充操作(AI推理工作负载中对内存需求相对较低的部分)转移至配备GDDR7的独立GPU Rubin CPX上。这项设计策略可能基于以下判断:预填充操作对内存带宽的要求相对较低,因此无需采用HBM技术。因此,Rubin CPX的内存规格最终改为HBM这一事实意义重大。这表明,即使是预填充操作在实际生产环境中也需要较高的内存带宽和容量,而GDDR7最终不足以提供足够的性能效率。由于英伟达尚未正式宣布这一规格变更,我们尚未将Rubin CPX相关的HBM需求纳入我们的HBM模型。如果这一潜在需求得以实现,HBM供应短缺预计将进一步加剧。
KIS:Rubin CPX从GDDR7转向采用HBM技术
根据我们的渠道调查,Rubin CPX预计将采用HBM技术,而非GDDR7。此前,英伟达曾宣布计划将预填充操作(AI推理工作负载中对内存需求相对较低的部分)转移至配备GDDR7的独立GPU Rubin CPX上。这项设计策略可能基于以下判断:预填充操作对内存带宽的要求相对较低,因此无需采用HBM技术。因此,Rubin CPX的内存规格最终改为HBM这一事实意义重大。这表明,即使是预填充操作在实际生产环境中也需要较高的内存带宽和容量,而GDDR7最终不足以提供足够的性能效率。由于英伟达尚未正式宣布这一规格变更,我们尚未将Rubin CPX相关的HBM需求纳入我们的HBM模型。如果这一潜在需求得以实现,HBM供应短缺预计将进一步加剧。
玉渊谭天:美方新关税可能面临司法诉讼
美国最新加征的所谓“临时关税”,援引的是很久没有使用的《1974年贸易法》第122条,理由是“从根本上解决美国国际收支失衡”,尤其是解决美国存在巨额贸易逆差的问题。但第122条的适用前提是,美国国际收支出现根本性的问题。法律上对此的判断依据并不是单一的货物贸易逆差,而是包括资本流动、商品和服务贸易在内的整体国际收支状况。从这个角度看,美国这项关税生效之后,很可能像此前一样面临被起诉的风险。
来源:财联社
美国最新加征的所谓“临时关税”,援引的是很久没有使用的《1974年贸易法》第122条,理由是“从根本上解决美国国际收支失衡”,尤其是解决美国存在巨额贸易逆差的问题。但第122条的适用前提是,美国国际收支出现根本性的问题。法律上对此的判断依据并不是单一的货物贸易逆差,而是包括资本流动、商品和服务贸易在内的整体国际收支状况。从这个角度看,美国这项关税生效之后,很可能像此前一样面临被起诉的风险。
来源:财联社
谷歌副总裁警告称“大模型封装”与“模型聚合”将死
生成式人工智能的蓬勃发展几乎每分钟都能催生一家初创公司,但随着热潮逐渐消退,曾经炙手可热的大模型应用封装和AI聚合平台如今更像是前车之鉴。负责谷歌全球创业团队副总裁的 Darren Mowry 表示,那些依赖这些概念的创业公司已经亮起“发动机故障灯”。
大模型封装器本质上是指那些将现有的大型语言模型与产品或用户体验层进行封装,以解决特定问题的创业公司,例如使用特定提示词引导模型完成业务需求。“如果你真的只是依赖后端模型来完成所有工作,并且几乎是简单地贴牌生产,那么业界已经对这种做法失去了耐心。” 而随着模型提供商自身也开始拓展企业级功能和多模型策略,AI聚合商也面临着利润压力,这可能会使中间商失去市场。
生成式人工智能的蓬勃发展几乎每分钟都能催生一家初创公司,但随着热潮逐渐消退,曾经炙手可热的大模型应用封装和AI聚合平台如今更像是前车之鉴。负责谷歌全球创业团队副总裁的 Darren Mowry 表示,那些依赖这些概念的创业公司已经亮起“发动机故障灯”。
大模型封装器本质上是指那些将现有的大型语言模型与产品或用户体验层进行封装,以解决特定问题的创业公司,例如使用特定提示词引导模型完成业务需求。“如果你真的只是依赖后端模型来完成所有工作,并且几乎是简单地贴牌生产,那么业界已经对这种做法失去了耐心。” 而随着模型提供商自身也开始拓展企业级功能和多模型策略,AI聚合商也面临着利润压力,这可能会使中间商失去市场。