Qwen-Image-Layered:面向内在可编辑性的图层分解
2025 年 12 月 19 日,QwenTeam(由阿里云支持)发布了名为 Qwen-Image-Layered 的图像分解模型。该模型旨在通过将静态图像重新构想为可组合的 RGBA 图层,赋予图像“内在的可编辑性”。通过将图像元素物理地隔离到不同图层中,该方法实现了高保真的编辑操作,确保在独立操作某一元素时不会影响图像的其他内容。
该模型支持多种高精度编辑任务,包括对特定图层重新着色、替换图层中的特定对象(如人物性别转换)、以及修改图像内的文字内容。此外,其分层结构天然支持删除物体、无损缩放和自由移动物体等基本操作,且不会引入常见的形变或失真。Qwen-Image-Layered 具备极高的灵活性,支持生成可变数量的图层,并允许对任一图层进行递归分解,从而实现无限层级的细节细化。
2025 年 12 月 18 日,研究论文发布于 arXiv(2512.15603);19 日,模型权重、技术博客正式上线 Hugging Face 与 ModelScope;截至 12 月 22 日,用户已可通过 Hugging Face Spaces 和 ModelScope Studio 进行在线体验。
Qwen Blog
2025 年 12 月 19 日,QwenTeam(由阿里云支持)发布了名为 Qwen-Image-Layered 的图像分解模型。该模型旨在通过将静态图像重新构想为可组合的 RGBA 图层,赋予图像“内在的可编辑性”。通过将图像元素物理地隔离到不同图层中,该方法实现了高保真的编辑操作,确保在独立操作某一元素时不会影响图像的其他内容。
该模型支持多种高精度编辑任务,包括对特定图层重新着色、替换图层中的特定对象(如人物性别转换)、以及修改图像内的文字内容。此外,其分层结构天然支持删除物体、无损缩放和自由移动物体等基本操作,且不会引入常见的形变或失真。Qwen-Image-Layered 具备极高的灵活性,支持生成可变数量的图层,并允许对任一图层进行递归分解,从而实现无限层级的细节细化。
2025 年 12 月 18 日,研究论文发布于 arXiv(2512.15603);19 日,模型权重、技术博客正式上线 Hugging Face 与 ModelScope;截至 12 月 22 日,用户已可通过 Hugging Face Spaces 和 ModelScope Studio 进行在线体验。
Qwen Blog