19:08 · May 20, 2025 · Tue × Google 在 Google IO 大会上发布 Gemini 2.5 Pro Deep Think在 USAMO 2025 中取得优异成绩,这是目前最难的数学基准之一在 LiveCodeBench 上领先,这是竞赛级编码的艰难基准在测试多模态推理的 MMMU 上表现出色