Google 发布 Gemini 3.1 Flash Live
Google 于 2026 年 3 月 26 日公布 Gemini 3.1 Flash Live,将其定位为当前最高质量的 Gemini 音频与语音模型。这次更新的重点是更低延迟、更自然的语音节奏,以及更稳定的实时对话体验。该模型已经进入 Google 的多条产品线,开发者可通过 Google AI Studio 中的 Gemini Live API 预览接入,企业侧可用于 Gemini Enterprise for Customer Experience,普通用户则会在 Gemini Live 和 Search Live 中直接感受到变化。
Gemini 3.1 Flash Live 在 ComplexFuncBench Audio 上达到 90.8%,在 Audio MultiChallenge 上达到 36.1%。模型卡还显示,它支持音频、图像、视频和文本输入,最高 128K 上下文窗口,输出为音频和文本,说明这代模型已经明显面向实时代理和多模态交互场景设计。
Google 表示 3.1 Flash Live 生成的全部音频都会嵌入 SynthID 水印,用于后续识别 AI 生成内容,并降低误导性传播风险。
Google
Google 于 2026 年 3 月 26 日公布 Gemini 3.1 Flash Live,将其定位为当前最高质量的 Gemini 音频与语音模型。这次更新的重点是更低延迟、更自然的语音节奏,以及更稳定的实时对话体验。该模型已经进入 Google 的多条产品线,开发者可通过 Google AI Studio 中的 Gemini Live API 预览接入,企业侧可用于 Gemini Enterprise for Customer Experience,普通用户则会在 Gemini Live 和 Search Live 中直接感受到变化。
Gemini 3.1 Flash Live 在 ComplexFuncBench Audio 上达到 90.8%,在 Audio MultiChallenge 上达到 36.1%。模型卡还显示,它支持音频、图像、视频和文本输入,最高 128K 上下文窗口,输出为音频和文本,说明这代模型已经明显面向实时代理和多模态交互场景设计。
Google 表示 3.1 Flash Live 生成的全部音频都会嵌入 SynthID 水印,用于后续识别 AI 生成内容,并降低误导性传播风险。