Google 推出 Gemini 3.1 Flash-LiteGoogle 在 2026 年 3 月 3 日的官方博客中宣布推出 Gemini 3.1 Flash-Lite，并将其定位为 Gemini 3 系列中“最快、最具成本效率”的型号，面向高吞吐量的开发者工作负载

18:29 · Mar 3, 2026 · Tue

Google 推出 Gemini 3.1 Flash-Lite

Google 在 2026 年 3 月 3 日的官方博客中宣布推出 Gemini 3.1 Flash-Lite，并将其定位为 Gemini 3 系列中“最快、最具成本效率”的型号，面向高吞吐量的开发者工作负载。该模型即日起以预览形式向开发者开放（通过 Google AI Studio 的 Gemini API），并通过 Vertex AI 面向企业用户提供。

价格为每 100 万输入 token 0.25 美元、每 100 万输出 token 1.50 美元。性能方面，Google 引用 Artificial Analysis 的基准结果称，相比 Gemini 2.5 Flash，3.1 Flash-Lite 的首 token 输出时间快 2.5 倍，输出速度提升 45%，以满足高频、低时延的实时交互需求。

Google 称该模型在 Arena.ai 排行榜上达到 1432 的 Elo，并在若干推理与多模态理解测试中给出了 86.9%（GPQA Diamond）与 76.8%（MMMU Pro）的结果，同时宣称其在同档模型对比中表现领先，并可超过上一代更大体量的 Gemini 型号（如 2.5 Flash）。

Google：Gemini 3.1 Flash-Lite: Built for intelligence at scale