AI

通义千问 Qwen-Image-Layered 模型问世,实现图片分层编辑新突破

PConline 2025-12-22 15:53:00
产品动态
由华为云驱动

近日,通义千问团队发布全新图像生成模型 Qwen - Image - Layered。该模型借助“图层拆解”技术,提出“图像解耦”思路,将图片分解为可独立操作的 RGBA 图层。亮点有 RGBA - VAE 技术、VLD - MMDiT 架构,能完成重着色等操作。目前,技术报告、代码仓库及 Demo 已上线,有望推动图像编辑领域发展。

通义千问团队发布全新图像生成模型 Qwen-Image-Layered,借助“图层拆解”技术让静态图片可编辑。它提出“图像解耦”思路,将图片分解为可独立操作的 RGBA 图层。

该模型亮点颇多,如 RGBA-VAE 技术让 RGB 图像与 RGBA 图层在潜空间“对话”,VLD - MMDiT 架构能灵活处理 3 到 10 层以上。应用上,能完成重着色、物体替换等操作,支持可变数量图层分解。这背后,模型历经多阶段进化。目前,其技术报告、代码仓库及 Demo 已分别在 arXiv、Github、ModelScope 上线,有望推动图像编辑领域发展。

点击展开全文
打开APP,阅读体验更佳

网友评论

聚超值推荐

更多优惠

相关推荐

相关产品
取消