高效注意力机制:引入 DeepSeek 稀疏注意力 (DSA),在不牺牲性能的前提下,通过降低计算复杂度来优化长上下文场景。
可扩展的强化学习:利用稳健的强化学习框架和可扩展的计算资源,实现了 GPT-5 级别的性能。其中,高计算量版本 DeepSeek-V3.2-Speciale 的性能超越了 GPT-5,并在推理能力上与 Gemini-3.0-Pro 持平。
高级数据合成:开发了大规模任务合成流程,增强了模型在复杂交互环境中的推理能力、服从性和泛化能力。
DeepSeek-V3.2 官方评估结果超过 GPT-5,仅次于 Gemini 3 Pro,同时 DeepSeek-V3.2-Speciale 成功斩获 IMO 2025、CMO 2025、ICPC World Finals 2025 及 IOI 2025 金牌。
来源:DeepSeek / HuggingFace 2
争夺非洲 IPv4 地址之战
2013 年 Lu 在非洲岛国塞舌尔注册了一家公司 Cloud Innovation,向 African Network Information Centre(Afrinic)申请 IP 地址。Afrinic 在 2013-2016 年间向 Cloud Innovation 分配了 620 万 IPv4 地址,比非洲人口最多的尼日利亚拥有的 IPv4 地址还要多。Cloud Innovation 将其拥有的 IPv4 地址转让给 Lu 在香港创办的公司如 Larus,再由 Larus 将地址出租给其它公司使用。Lu 声称他的关联公司控制着逾千万 IPv4 地址。互联网的设计者可能没有预想到会有人将 IP 地址货币化。Lu 的行为引发了争议和冲突。African 在 2020 年要求收回地址,称这些地址不应该在非洲之外使用。为了保住其持有的地址,Lu 在毛里求斯起诉了 Afrinic。当地法院于 2021 年 7 月冻结了 Afrinic 的银行账户,导致该机构瘫痪,破坏了该机构继续分配新 IPv4 地址的能力。Lu 还通过大量诉讼试图压制对他的批评,声称这些批评损害了他的声誉。
来源:Solidot
2013 年 Lu 在非洲岛国塞舌尔注册了一家公司 Cloud Innovation,向 African Network Information Centre(Afrinic)申请 IP 地址。Afrinic 在 2013-2016 年间向 Cloud Innovation 分配了 620 万 IPv4 地址,比非洲人口最多的尼日利亚拥有的 IPv4 地址还要多。Cloud Innovation 将其拥有的 IPv4 地址转让给 Lu 在香港创办的公司如 Larus,再由 Larus 将地址出租给其它公司使用。Lu 声称他的关联公司控制着逾千万 IPv4 地址。互联网的设计者可能没有预想到会有人将 IP 地址货币化。Lu 的行为引发了争议和冲突。African 在 2020 年要求收回地址,称这些地址不应该在非洲之外使用。为了保住其持有的地址,Lu 在毛里求斯起诉了 Afrinic。当地法院于 2021 年 7 月冻结了 Afrinic 的银行账户,导致该机构瘫痪,破坏了该机构继续分配新 IPv4 地址的能力。Lu 还通过大量诉讼试图压制对他的批评,声称这些批评损害了他的声誉。
来源:Solidot
HIV功能性治愈研究取得重要进展
2025年,两项独立临床试验——非洲的FRESH试验和英国/丹麦的RIO试验——在艾滋病(HIV)功能性治愈领域取得了突破性进展。研究人员通过向HIV感染者输注工程抗体,发现部分参与者在停止常规抗逆转录病毒治疗后,仍能将病毒载量维持在无法检测的水平长达数年。
这些概念验证试验表明,利用工程抗体可有效激活人体免疫系统,产生类似疫苗的持久效果,从而在无需每日用药的情况下实现对HIV的长期控制。此项研究为全球约4000万HIV感染者带来了希望,未来有望优化抗体疗法,让更多人从中受益。
来源:arstechnica
2025年,两项独立临床试验——非洲的FRESH试验和英国/丹麦的RIO试验——在艾滋病(HIV)功能性治愈领域取得了突破性进展。研究人员通过向HIV感染者输注工程抗体,发现部分参与者在停止常规抗逆转录病毒治疗后,仍能将病毒载量维持在无法检测的水平长达数年。
这些概念验证试验表明,利用工程抗体可有效激活人体免疫系统,产生类似疫苗的持久效果,从而在无需每日用药的情况下实现对HIV的长期控制。此项研究为全球约4000万HIV感染者带来了希望,未来有望优化抗体疗法,让更多人从中受益。
来源:arstechnica
台湾上调2025年经济增长预期
台湾统计部门周五公布的数据显示,7-9月当季经济同比增长8.21%,好于初值7.64%。经季节性调整后,第三季度经济环比增长率从1.31%上修至1.71%。
台湾将其2025年经济增长预期从三个月前预测的4.45%上调至7.37%。
该统计部门将此次预期修正归因于主要云服务提供商加速建设AI基础设施,以及美国推迟征收半导体相关关税。
cn.wsj.com
台湾统计部门周五公布的数据显示,7-9月当季经济同比增长8.21%,好于初值7.64%。经季节性调整后,第三季度经济环比增长率从1.31%上修至1.71%。
台湾将其2025年经济增长预期从三个月前预测的4.45%上调至7.37%。
该统计部门将此次预期修正归因于主要云服务提供商加速建设AI基础设施,以及美国推迟征收半导体相关关税。
cn.wsj.com
取款超5万不再需要登记,2026年1月1日起施行
其中,“个人存取现金超5万元需登记资金来源”的规定取消,与此前的征求意见稿保持了一致,可以说是“该严则严、当放则放”。《管理办法》自2026年1月1日起施行。
来源:新浪财经
其中,“个人存取现金超5万元需登记资金来源”的规定取消,与此前的征求意见稿保持了一致,可以说是“该严则严、当放则放”。《管理办法》自2026年1月1日起施行。
来源:新浪财经
工行、农行、中行、建行、交行、邮储六大行集体停售五年期大额存单,仅剩的三年期产品利率普遍降到1.5%至1.75%,且额度紧张。与此同时,部分中小银行也开始调整甚至直接取消三年期、五年期普通定期存款产品。
来源:中国基金报
来源:中国基金报
工具过载正在削弱智能体性能
“工具过载”正成为智能体性能发展的关键瓶颈。这一判断基于 VS Code 中 Copilot Chat 的大规模测试与多项基准实验,结论呈现出与长期“工具越多越好”的直觉相反的结果。
工具越多,模型的决策空间越大,每次调用都需在庞大集合中反复试探,造成推理负担加重。工具描述与状态占用上下文与缓存,使关键语义信息被稀释,增加无效推理成本。在复杂工具集下,模型更容易采取不必要的工具调用。
Github的解决方式是利用内部嵌入模型按语义相似度将工具聚为虚拟类别,避免一次性暴露所有工具,通过嵌入匹配预选最相关工具,使模型无需盲目探索。
“工具过载”正成为智能体性能发展的关键瓶颈。这一判断基于 VS Code 中 Copilot Chat 的大规模测试与多项基准实验,结论呈现出与长期“工具越多越好”的直觉相反的结果。
工具越多,模型的决策空间越大,每次调用都需在庞大集合中反复试探,造成推理负担加重。工具描述与状态占用上下文与缓存,使关键语义信息被稀释,增加无效推理成本。在复杂工具集下,模型更容易采取不必要的工具调用。
Github的解决方式是利用内部嵌入模型按语义相似度将工具聚为虚拟类别,避免一次性暴露所有工具,通过嵌入匹配预选最相关工具,使模型无需盲目探索。
GitHub 调整 Copilot 工具体系
引入嵌入路由与虚拟工具,默认工具缩减至 13 个,GitHub 宣布在 VS Code 中对 Copilot Chat 的工具体系进行重构,通过“嵌入引导的工具路由(Embedding-Guided Tool Routing)”和“自适应工具聚类(Adaptive Tool Clustering)”两项机制,提高多工具智能体的效率与成功率,并将默认内置工具从约 40 个收缩为 13 个核心工具。GitHub 表示,在 SWE-Lancer、SWEbench-Verified 等基准上,该方案在 GPT-5 与 Sonnet 4.5 下带来 2–5 个百分点的任务成功率提升,平均端到端响应时间缩短约 400 毫秒。
在新方案中,系统将相似工具折叠为“虚拟工具”,仅在通过向量匹配到用户需求时动态展开,避免无关工具干扰。该方案使工具调用覆盖率达到 94.5%,平均响应时间缩短 400 毫秒,并在 GPT-5/Sonnet 4.5 基准测试中将任务成功率提升了 2–5%。
Github Blog
引入嵌入路由与虚拟工具,默认工具缩减至 13 个,GitHub 宣布在 VS Code 中对 Copilot Chat 的工具体系进行重构,通过“嵌入引导的工具路由(Embedding-Guided Tool Routing)”和“自适应工具聚类(Adaptive Tool Clustering)”两项机制,提高多工具智能体的效率与成功率,并将默认内置工具从约 40 个收缩为 13 个核心工具。GitHub 表示,在 SWE-Lancer、SWEbench-Verified 等基准上,该方案在 GPT-5 与 Sonnet 4.5 下带来 2–5 个百分点的任务成功率提升,平均端到端响应时间缩短约 400 毫秒。
在新方案中,系统将相似工具折叠为“虚拟工具”,仅在通过向量匹配到用户需求时动态展开,避免无关工具干扰。该方案使工具调用覆盖率达到 94.5%,平均响应时间缩短 400 毫秒,并在 GPT-5/Sonnet 4.5 基准测试中将任务成功率提升了 2–5%。
Github Blog
传闻称 NVIDIA 正在改变其做法,只向 AIC 合作伙伴提供裸硅片,而不再捆绑其惯常的 GPU 与内存套件。通常,像 NVIDIA、AMD 和 Intel 这样的 GPU 厂商会将 GPU 晶片与 GDDR 内存作为套件提供给 AIC 合作伙伴。这些合作伙伴随后将组件焊接到其定制的 PCB 上,常常会修改布局和散热系统。然而,据 Golden Pig Upgrade 称,由于内存短缺影响了公司满足订单的能力,NVIDIA 可能会停止这一做法,只提供裸硅片。
据称,AIC 合作伙伴现在需负责从 Micron、SK Hynix 和 Samsung 等内存制造商处自行采购 DRAM。AIC 能否成功获取 DRAM 将取决于其与这些内存厂商的关系以及能否以合理价格确保足够的产能。对 NVIDIA 而言,这一策略或许能让公司在不面临短缺或问题的情况下出货其 GeForce RTX 50 系列 Founders Edition GPU,同时也能为其 “Rubin CPX” 和 “Vera Rubin” 服务器产品确保充足的产能。
据称,AIC 合作伙伴现在需负责从 Micron、SK Hynix 和 Samsung 等内存制造商处自行采购 DRAM。AIC 能否成功获取 DRAM 将取决于其与这些内存厂商的关系以及能否以合理价格确保足够的产能。对 NVIDIA 而言,这一策略或许能让公司在不面临短缺或问题的情况下出货其 GeForce RTX 50 系列 Founders Edition GPU,同时也能为其 “Rubin CPX” 和 “Vera Rubin” 服务器产品确保充足的产能。
微软研究院推出面向电脑操作的开源小模型 Fara-7B,定位为“Computer Use Agent(CUA)”,能够通过鼠标与键盘在网页上自主执行任务。模型规模仅 70 亿参数,但在 WebVoyager、Online-Mind2Web、DeepShop 及微软新提出的 WebTailBench 等基准上表现达到同尺寸最优,并接近更大模型的水平。
Fara-7B 依赖浏览器截图进行视觉感知,无需访问无障碍树等结构信息,即可预测点击、输入、滚动等操作步骤,支持表单填写、检索、比价、预订等多步网页任务。模型基于 Magentic-One 多智能体系统生成的合成数据训练,总计约 14.5 万条任务轨迹。
该模型已在 Microsoft Foundry 与 Hugging Face 上架,采用 MIT 许可证开源,同时提供 Magentic-UI 实验环境与面向 Copilot+ PC 的量化版本,可在 Windows 11 设备上本地运行并利用 NPU 加速。
microsoft
特朗普称将“永久暂停”来自“第三世界”的移民
特朗普在 Truth Social 上表示,移民已经“侵蚀”了国家进步,并誓言要“永久暂停来自所有第三世界国家的移民”,以让美国的体系得以恢复。他的这番言论是在华盛顿发生一起阿富汗籍男子袭击两名国民警卫队成员的事件之后发表的,特朗普借此进一步强化其政府的反移民立场。
特朗普在 Truth Social 上表示,移民已经“侵蚀”了国家进步,并誓言要“永久暂停来自所有第三世界国家的移民”,以让美国的体系得以恢复。他的这番言论是在华盛顿发生一起阿富汗籍男子袭击两名国民警卫队成员的事件之后发表的,特朗普借此进一步强化其政府的反移民立场。