阿里开源 Qwen-Image-Edit

AI资讯 7个月前硕雀

76 0 0

阿里开源的Qwen-Image-Edit是一个基于Qwen-Image模型进一步训练的图像编辑工具，旨在拓展文本渲染能力至图像编辑领域。该模型基于20B参数的Qwen-Image模型训练，支持语义和外观双重编辑，能够精准编辑图片中的文字，同时保持图像的自然过渡和一致性。

Qwen-Image-Edit的主要特性包括：

语义与外观双重编辑：支持低阶视觉外观编辑和高阶视觉语义编辑，允许整体像素变化但保持语义一致。
精准文字编辑：支持中英文双语文字编辑，可在保留原有字体、字号、风格的前提下，直接对图片中的文字进行增、删、改等操作。
强大的基准性能：在图像编辑任务上具备SOTA性能，是一个强大的图像编辑基础模型。

用户可通过Qwen Chat体验Qwen-Image-Edit，但目前在免费体验中存在次数限制。该模型在文本驱动图像编辑方面表现出色，如文字生成、视角切换、场景创设、背景变幻等，主体保持较高一致性，光线和质感随场景自然变化。尽管在连续多轮修改中精准性和一致性有待提高，以及在草书等复杂字体生成上有局限，但Qwen-Image-Edit已能实现大多物体增删、文字生成、角度转换等实用功能，有望推动图像生成领域的发展，降低视觉内容创作的技术门槛，并激发更多创新应用。

Qwen-Image-Edit的发布标志着图像处理领域可能迎来一场革新，预示着图像处理工具的未来发展方向

Qwen-Image-Edit

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！

阿里开源 Qwen-Image-Edit

OpenAI 发布生产级 AI 应用开发全栈学习路径 xAI官方技术公告

小红书发布DynamicFace人脸生成技术，实现高质量图像视频人脸融合