Google 推出 Gemini 3.1 Flash-Lite

Google 在 2026 年 3 月 3 日的官方博客中宣布推出 Gemini 3.1 Flash-Lite,并将其定位为 Gemini 3 系列中“最快、最具成本效率”的型号,面向高吞吐量的开发者工作负载。该模型即日起以预览形式向开发者开放(通过 Google AI Studio 的 Gemini API),并通过 Vertex AI 面向企业用户提供。

价格为每 100 万输入 token 0.25 美元、每 100 万输出 token 1.50 美元。性能方面,Google 引用 Artificial Analysis 的基准结果称,相比 Gemini 2.5 Flash,3.1 Flash-Lite 的首 token 输出时间快 2.5 倍,输出速度提升 45%,以满足高频、低时延的实时交互需求。

Google 称该模型在 Arena.ai 排行榜上达到 1432 的 Elo,并在若干推理与多模态理解测试中给出了 86.9%(GPQA Diamond)与 76.8%(MMMU Pro)的结果,同时宣称其在同档模型对比中表现领先,并可超过上一代更大体量的 Gemini 型号(如 2.5 Flash)。

Google:Gemini 3.1 Flash-Lite: Built for intelligence at scale
 
 
Back to Top