Google推出升级版图像生成模型Nano Banana Pro,基于最新发布的大语言模型Gemini 3构建。新模型支持生成2K和4K高分辨率图像,提升了文字渲染准确性和多语言字体样式生成能力,并新增网络搜索功能。该模型面向专业用户,可精确控制相机角度、景深、光照等参数,支持在单张图像中融合最多14个物体并保持5人面部一致性。新模型已整合至Gemini应用、Workspace工具及开发者API中,但生成成本较前代提高约3-6倍。Google同时在Gemini应用中集成SynthID水印检测技术,用于识别AI生成图像。
来源:TechCrunch / Google Blog