Skip to main content

Google 发布 Gemini 3.5 Flash,重点转向智能体与编码任务根据 Google DeepMind 的模型卡,Gemini 3.5 Flash 基于 Gemini 3 Flash 推理基础构建,支持文本、图像、音频和视频输入,最高 100 万 token 上下文,单次输出最高 64K token

  1. Google 发布 Gemini 3.5 Flash,重点转向智能体与编码任务

    根据 Google DeepMind 的模型卡,Gemini 3.5 Flash 基于 Gemini 3 Flash 推理基础构建,支持文本、图像、音频和视频输入,最高 100 万 token 上下文,单次输出最高 64K token。Google 将其描述为原生多模态推理模型,并提供可调节的 thinking levels,用于平衡质量、成本与延迟。

    性能方面,Google 称 Gemini 3.5 Flash 是其目前最强的智能体和编码模型,在 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 等基准上超过 Gemini 3.1 Pro,并在 CharXiv Reasoning 多模态理解测试中取得 84.2%。

    API 定价方面,Gemini 3.5 Flash 标准付费档为每 100 万输入 token 1.50 美元、每 100 万输出 token 9.00 美元;Batch 与 Flex 为 0.75 美元输入、4.50 美元输出;Priority 为 2.70 美元输入、16.20 美元输出。

    Google