2025 年 11 月 18 日晚间 —— Google 正式推出新一代大型模型 Gemini 3,并在发布当日同步部署至 Search AI Mode、Gemini App、AI Studio 与 Vertex AI 等全线产品。官方将其定位为迄今最强的推理与多模态模型。
根据 Google 公布的信息,Gemini 3 在主要基准测试中全面领先上一代,包括 LMArena、GPQA、MathArena 以及多模态 MMMU-Pro 与 Video-MMMU,整体推理深度与事实准确性均有明显提升。Google 同时推出增强推理版本 Gemini 3 Deep Think,但该模式仍在进行额外的安全审查,暂未面向公众开放。
在实际应用方面,Gemini 3 强化长程规划与代理执行能力,可在更复杂的多步骤任务中保持稳定决策。Google 也发布了新的 Google Antigravity 代理式开发平台,使开发者能以更高层级的任务方式与模型协作,生成 UI、代码并执行自动化流程。
安全性方面,Google 表示 Gemini 3 经过最全面的安全评估,重点提升对提示注入、迎合性输出与网络滥用的防护。同时,模型通过多家独立机构的外部评估。
来源: Google Blog