LoopDNS资讯播报
-
-
-
- OpenAI 模型给出反例,平面单位距离问题出现重大进展
OpenAI 于 2026 年 5 月 20 日发布研究进展,称其内部通用推理模型在平面单位距离问题上给出新的数学构造,推翻了一个长期存在的离散几何猜想。平面单位距离问题由 Paul Erdős 于 1946 年提出,问题本身非常简洁:给定平面中的 n 个点,最多可以有多少对点之间的距离恰好等于 1。这个问题长期被视为组合几何中最著名、也最容易表述的开放问题之一。
过去几十年中,数学界普遍认为,接近最优的例子应当与方格构造密切相关。Erdős 的经典构造可产生略高于线性的单位距离数量,而已有的最好上界长期停留在 O(n^{4/3})。更强的直觉是,最大单位距离数 ν(n) 应接近 n^{1+o(1)},也就是说,虽然可能略高于线性,但不应出现固定多项式指数的提升。
这次公开的结果直接否定了这一预期。证明稿的主定理表明,存在绝对常数 δ > 0,并且存在无穷多个正整数 n,使得 ν(n) ≥ n^{1+δ}。这意味着,某些点集中的单位距离对数量不仅仅是略高于线性,而是具有固定指数的多项式提升。因此,该结果并不是给出 ν(n) 的完整精确公式,而是以反例方式推翻了 Erdős 单位距离猜想的核心上界预期。
外部数学家发布的评注稿由 Noga Alon、Thomas F. Bloom、W. T. Gowers、Daniel Litt、Will Sawin、Arul Shankar、Jacob Tsimerman、Victor Wang 和 Melanie Matchett Wood 等人署名。该评注稿称,其内容是对 OpenAI 生成反例的“人类消化版”,并在一定程度上进行了简化和推广。
正式证明稿 PDF
外部数学家评注稿 PDF
视频素材链接
模型推理摘要 PDF
OpenAI 博客 - 拆解 Anthropic:最好的 AI 公司,可能也是一种组织发明
过去两年,外界反复有明星 researcher 说 scaling laws 撞墙了,pretraining 的边际收益已经见顶。就我们和各家 researcher 的交流感受,Anthropic 一直是所有 labs 里最相信 scaling laws 的,也是把 pretraining 和数据做得最扎实的,没有在新范式上分散精力。
事后看这也是对的。Claude 的能力跃迁,很大一部分就来自 pretraining 的扎实投入。
Anthropic是御三家里唯一很早就放弃多模态的,且从来没讲过架构创新,没强调过 reasoning model、RL、continual learning 等概念,只做好语言模型的 scaling,只重点做 coding 一个方向,把最关键的能力打穿。
▎Source -
-
- ASML CEO称AI推动芯片供不应求,呼吁围绕对华芯片制造设备出口制定更一致的规则
芯片制造设备巨头ASML首席执行官富凯告诉路透,在可预见的未来,蓬勃发展的全球半导体市场将因供应紧张而“形势严峻”,因为来自人工智能、卫星和机器人领域的需求已超过了行业的生产能力;芯片供应链中可能持续出现零星瓶颈。富凯表示,ASML正在提升产量并提高设备生产效率,同时推进新技术研发,以应对需求增长。他呼吁制定更统一的规则,规范向中国出口芯片制造设备。
来源:路透社 -
- 三星工会官方称,根据暂定协议,三星预计将拨出约11.5%的运营利润用于发放奖金。
-
-
-
-
-
- 5月20日传出消息,NVIDIA专为中国市场定制的旗舰游戏显卡RTX 5090 D v2已被中国海关禁止进口。本次禁令由中方发起,NVIDIA方面完全措手不及,该型号仅面向中国市场、无法在其他国家和地区销售,海关已通知相关物流公司该产品不会获发进口通行证,所有相关货物无法进入中国市场,目前暂未收到关于禁令原因的官方说明。
来源:Wccfetch -
- Gemini Omni 正式发布,Google 把多模态视频生成纳入 Gemini 体系
Google 在 I/O 2026 期间发布 Gemini Omni,定位为新的多模态生成模型家族,首发模型是 Gemini Omni Flash。该模型以视频为起点,支持混合文本、图片、音频和视频作为输入,生成带音频的高分辨率视频,并可通过对话继续修改画面、动作、角色和风格。
与传统“文字生成视频”工具相比,Gemini Omni 的重点是从现有素材出发进行重构和编辑。Google 称其可在连续编辑中保持角色、物理关系和场景上下文,并将 Gemini 的现实世界知识引入视频生成,使结果不只追求视觉真实,也更强调叙事和语义一致性。
deepmind - Google 发布 Gemini 3.5 Flash,重点转向智能体与编码任务
根据 Google DeepMind 的模型卡,Gemini 3.5 Flash 基于 Gemini 3 Flash 推理基础构建,支持文本、图像、音频和视频输入,最高 100 万 token 上下文,单次输出最高 64K token。Google 将其描述为原生多模态推理模型,并提供可调节的 thinking levels,用于平衡质量、成本与延迟。
性能方面,Google 称 Gemini 3.5 Flash 是其目前最强的智能体和编码模型,在 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 等基准上超过 Gemini 3.1 Pro,并在 CharXiv Reasoning 多模态理解测试中取得 84.2%。
API 定价方面,Gemini 3.5 Flash 标准付费档为每 100 万输入 token 1.50 美元、每 100 万输出 token 9.00 美元;Batch 与 Flex 为 0.75 美元输入、4.50 美元输出;Priority 为 2.70 美元输入、16.20 美元输出。
Google -