阿里开源 Qwen-Image-Edit

阿里开源的Qwen-Image-Edit是一个基于Qwen-Image模型进一步训练的图像编辑工具,旨在拓展文本渲染能力至图像编辑领域。该模型基于20B参数的Qwen-Image模型训练,支持语义和外观双重编辑,能够精准编辑图片中的文字,同时保持图像的自然过渡和一致性。

Qwen-Image-Edit的主要特性包括:

  1. 语义与外观双重编辑:支持低阶视觉外观编辑和高阶视觉语义编辑,允许整体像素变化但保持语义一致。
  2. 精准文字编辑:支持中英文双语文字编辑,可在保留原有字体、字号、风格的前提下,直接对图片中的文字进行增、删、改等操作。
  3. 强大的基准性能:在图像编辑任务上具备SOTA性能,是一个强大的图像编辑基础模型。

用户可通过Qwen Chat体验Qwen-Image-Edit,但目前在免费体验中存在次数限制。该模型在文本驱动图像编辑方面表现出色,如文字生成、视角切换、场景创设、背景变幻等,主体保持较高一致性,光线和质感随场景自然变化。尽管在连续多轮修改中精准性和一致性有待提高,以及在草书等复杂字体生成上有局限,但Qwen-Image-Edit已能实现大多物体增删、文字生成、角度转换等实用功能,有望推动图像生成领域的发展,降低视觉内容创作的技术门槛,并激发更多创新应用。

Qwen-Image-Edit的发布标志着图像处理领域可能迎来一场革新,预示着图像处理工具的未来发展方向

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!