谷歌发布Gemini 3.5实时翻译音频模型
谷歌于2026年6月9日推出最新音频模型Gemini 3.5 Live Translate。该模型支持超过70种语言的实时语音对译,可自动检测语种并生成保留原说话者语调、语速和音高的自然语音。与传统分段式系统不同,该模型采用持续生成技术,实现低延迟的流畅翻译。目前,该功能已向开发者及部分企业用户开放预览,并开始在全球范围内的iOS和Android版谷歌翻译应用中推广。
来源:Google Blog
谷歌于2026年6月9日推出最新音频模型Gemini 3.5 Live Translate。该模型支持超过70种语言的实时语音对译,可自动检测语种并生成保留原说话者语调、语速和音高的自然语音。与传统分段式系统不同,该模型采用持续生成技术,实现低延迟的流畅翻译。目前,该功能已向开发者及部分企业用户开放预览,并开始在全球范围内的iOS和Android版谷歌翻译应用中推广。
来源:Google Blog