Qwen-Image 2.0 | AI 图像生成

Qwen-Image 2.0 | AI 图像生成

Qwen-Image 信息概览

项目内容
名称Qwen-Image
中文生态名称通义千问 / Qwen
产品类型AI 图像生成与图像编辑模型系列
开发者Qwen Team / Alibaba Cloud
所属生态通义千问、Qwen、Qwen Studio、阿里云 Model Studio、ModelScope、阿里云百炼
首次发布时间2025年8月4日
基础模型规模20B
架构类型MMDiT
主要模型Qwen-ImageQwen-Image-EditQwen-Image-Edit-2509Qwen-Image-Edit-2511Qwen-Image-2512Qwen-Image 2.0
API 模型名称qwen-image、qwen-image-plus、qwen-image-max、qwen-image-2.0、qwen-image-2.0-pro、qwen-image-edit、qwen-image-edit-plus、qwen-image-edit-max
主要功能文生图、图像编辑、复杂文字渲染、中英文文字生成、海报生成、PPT / 信息图生成、风格迁移、对象增删、局部修改、图像文字编辑
开源许可Apache-2.0
官方体验入口通义千问
官方代码仓库QwenLM/Qwen-Image
官方博客Qwen Blog
API 入口Alibaba Cloud Model Studio

Qwen-Image 概述

Qwen-Image 是 Qwen 系列中的图像生成与图像编辑模型族,面向文本生成图像、图像编辑、复杂文字渲染、海报生成、PPT 生成、漫画生成、信息图生成和多风格视觉创作等场景。

Qwen-Image 的核心特征是对图像中文字内容的处理能力,尤其强调中文与英文的文字生成、排版控制、多行文本、段落语义和细粒度视觉细节。相较于许多通用文生图模型,Qwen-Image 更突出“图文一体”的生成能力,适合包含标题、副标题、说明文字、版式结构和复杂排版的视觉内容。

在产品入口上,普通用户可以通过 Qwen Studio 使用图像生成能力;开发者可以通过 Alibaba Cloud Model Studio 调用 Qwen 图像生成和图像编辑模型;研究者和工程用户也可以通过 GitHub、Hugging Face、ModelScope 等渠道获取模型、代码或权重信息。


Qwen-Image 名称与定位

Qwen-Image 既指最初发布的 20B 图像基础模型,也常用于泛指 Qwen 生态中的图像生成与编辑模型系列。

在不同场景中,相关名称含义如下:

名称所属场景含义
Qwen-Image基础模型 / 开源模型20B MMDiT 图像基础模型,重点面向复杂文字渲染和图像生成
Qwen-Image-Edit图像编辑模型基于 Qwen-Image 的图像编辑版本
Qwen-Image-Edit-2509图像编辑升级版本增强多图编辑、ControlNet 条件和编辑能力
Qwen-Image-Edit-2511图像编辑升级版本强调一致性提升
Qwen-Image-2512图像生成升级版本强调更真实的人像、更自然的纹理和更强文字渲染
Qwen-Image 2.0商业 API / 平台模型面向专业信息图、图文生成和生产级创作的升级模型
Qwen Studio用户产品入口面向普通用户的 Qwen 官方交互平台
Model StudioAPI 平台入口阿里云面向开发者和企业的模型调用平台

Qwen-Image 的产品定位偏向“图文生成”和“可控视觉内容生产”。它不只是生成艺术图像,也面向更实用的图像任务,例如海报、PPT、信息图、广告物料、漫画分镜、界面草图和带文字的商业视觉素材。


Qwen-Image 发展历史

2025年8月:Qwen-Image 发布

2025年8月4日,Qwen-Image 发布。

首个 Qwen-Image 是 20B MMDiT 图像基础模型,重点能力包括复杂文字渲染、精准图像编辑和多风格图像生成。模型支持生成包含中文、英文、多行文字、段落语义和细节排版的图像内容。

Qwen-Image 同时在 GitHub、Hugging Face、ModelScope 等渠道开放,并可在 Qwen Chat / Qwen Studio 中选择 Image Generation 体验。

2025年8月:Qwen-Image 接入 Qwen Studio 与 ComfyUI

2025年8月5日,Qwen-Image 接入 Qwen Chat / Qwen Studio 的 Image Generation 入口。

同日,Qwen-Image 也获得 ComfyUI 原生支持,方便工作流用户在节点式图像生成环境中使用。

2025年8月:Qwen-Image-Edit 发布

2025年8月18日,Qwen-Image-Edit 发布。

Qwen-Image-Edit 是 Qwen-Image 的图像编辑版本,建立在 20B Qwen-Image 模型之上,将 Qwen-Image 的文字渲染能力扩展到图像编辑任务中。它同时利用视觉语义控制和视觉外观控制,支持语义编辑、外观编辑和精确文字编辑。

2025年9月:Qwen-Image-Edit-2509 发布

2025年9月22日,Qwen-Image-Edit-2509 发布。

该版本增加对常用 ControlNet 图像条件的原生支持,例如关键点控制和草图控制,并强化图像编辑场景中的可控性。

2025年12月:Qwen-Image-Edit-2511 发布

2025年12月22日,Qwen-Image-Edit-2511 发布。

该版本定位为 Qwen-Image-Edit-2509 的增强版本,重点提升图像编辑中的一致性表现。

2025年12月:Qwen-Image-2512 发布

2025年12月30日,Qwen-Image-2512 发布。

该版本强调更真实的人像、更细腻的自然纹理和更强文字渲染能力,重点减少 AI 生成感,提升面部、年龄、景观、水体、毛发、材质和图文组合表现。

2026年2月:Qwen-Image 2.0 发布

2026年2月9日,Qwen-Image 2.0 发布。

Qwen-Image 2.0 面向专业信息图、精致排版、视觉表达和生产级图文生成场景。阿里云 Model Studio 后续提供 qwen-image-2.0 和 qwen-image-2.0-pro 等模型调用入口。

2026年3月:Qwen-Image 2.0 API 快照

阿里云 Model Studio 文档列出 qwen-image-2.0-2026-03-03 和 qwen-image-2.0-pro-2026-03-03 模型快照。

qwen-image-2.0 当前能力与 qwen-image-2.0-2026-03-03 相同;qwen-image-2.0-pro 当前能力与 qwen-image-2.0-pro-2026-03-03 相同。


Qwen-Image 模型版本 / 产品版本

Qwen-Image

Qwen-Image 是最初发布的 20B MMDiT 图像基础模型。

主要特点包括:

  • 20B 参数规模。
  • MMDiT 架构。
  • 复杂文字渲染。
  • 中文与英文文字生成。
  • 多行文本和段落级语义处理。
  • 专业排版能力。
  • 图像生成与图像编辑能力统一。
  • 原生 2K 分辨率支持。
  • 适用于海报、PPT、漫画、信息图和多风格图像生成。

Qwen-Image-Edit

Qwen-Image-Edit 是 Qwen-Image 的图像编辑版本。

主要能力包括:

  • 精确文字编辑。
  • 语义编辑。
  • 外观编辑。
  • 图像局部修改。
  • 保留原图视觉特征。
  • 基于视觉语义和视觉外观的双通路控制。
  • 适用于图像中文字替换、风格迁移、对象调整和细节修改。

Qwen-Image-Edit-2509

Qwen-Image-Edit-2509 是 Qwen-Image-Edit 的 2025 年 9 月升级版本。

主要特点包括:

  • 增强图像编辑控制。
  • 支持常用 ControlNet 图像条件。
  • 支持关键点控制。
  • 支持草图控制。
  • 改善结构可控生成。
  • 适合姿态控制、轮廓控制、草图转图和复杂编辑任务。

Qwen-Image-Edit-2511

Qwen-Image-Edit-2511 是 2025 年 12 月发布的图像编辑升级版本。

主要特点包括:

  • 提升图像编辑一致性。
  • 改善主体保持。
  • 改善编辑前后视觉连贯性。
  • 适合人物、商品、角色和多轮编辑任务。

Qwen-Image-2512

Qwen-Image-2512 是 2025 年 12 月发布的图像生成升级版本。

主要特点包括:

  • 更真实的人像表现。
  • 减少 AI 生成感。
  • 更丰富的面部和年龄细节。
  • 更细腻的自然纹理。
  • 更锐利的景观、水体、毛发和材质表现。
  • 更强文字渲染能力。
  • 更好的图文版式组合。

Qwen-Image 2.0

Qwen-Image 2.0 是 Qwen-Image 系列的 2.0 版本,面向更专业的图像生成、图文排版和视觉生产场景。

阿里云 Model Studio 中的相关模型包括:

  • qwen-image-2.0
  • qwen-image-2.0-2026-03-03
  • qwen-image-2.0-pro
  • qwen-image-2.0-pro-2026-03-03

主要定位包括:

  • 专业信息图生成。
  • 精致图文排版。
  • 商业海报生成。
  • 高质量图像生成。
  • 生产级视觉素材生成。
  • 面向 API 的稳定模型调用。

Qwen-Image 主要功能

文生图

Qwen-Image 支持根据文本提示生成图像,覆盖写实、插画、动漫、设计稿、海报、信息图、PPT、漫画和多种艺术风格。

其优势集中在带文字的图像生成场景,尤其适合标题、副标题、说明文字、标签、段落和版式较复杂的视觉内容。

复杂文字渲染

复杂文字渲染是 Qwen-Image 的核心能力。

可覆盖的场景包括:

  • 中文标题。
  • 英文标题。
  • 多行文字。
  • 段落级内容。
  • 海报文案。
  • PPT 页面文字。
  • 漫画对白。
  • 信息图标注。
  • 商品卖点文字。
  • UI 文案。
  • 细粒度排版元素。

中文图像文字生成

Qwen-Image 对中文文字生成进行了重点优化,适合中文海报、中文信息图、中文电商图、中文宣传图和中文排版设计。

典型场景包括:

  • 中文节日海报。
  • 中文课程封面。
  • 中文品牌广告。
  • 中文菜单。
  • 中文产品说明图。
  • 中文漫画分镜。
  • 中文社交媒体封面。

英文图像文字生成

Qwen-Image 同样支持英文图像文字生成,适合英文海报、英文广告、英文 PPT、英文信息图和国际化视觉素材。

专业排版生成

Qwen-Image 可用于生成具备版式结构的图像,例如:

  • PPT 页面。
  • 产品介绍页。
  • 信息图。
  • 商业海报。
  • 活动海报。
  • 教育图解。
  • 漫画页面。
  • 图文混排视觉稿。

图像编辑

Qwen 图像编辑模型支持复杂图文编辑任务,包括:

  • 中英文文字编辑。
  • 调色。
  • 细节增强。
  • 风格迁移。
  • 添加对象。
  • 删除对象。
  • 改变对象位置。
  • 修改人物动作。
  • 更换背景。
  • 改变服装或物体外观。

精确文字编辑

Qwen-Image-Edit 可对已有图像中的文字进行修改,适用于海报、广告图、商品图、PPT 页面和视觉模板的二次编辑。

典型任务包括:

  • 替换图中英文短语。
  • 替换中文标题。
  • 修改商品图标签。
  • 修改海报日期。
  • 调整图中文字内容。
  • 保留原有版式和视觉风格。

语义编辑

Qwen-Image-Edit 支持基于语义指令修改图像,例如:

  • 将人物改为站立姿势。
  • 改变背景地点。
  • 将照片变成卡通头像。
  • 移除画面中不需要的元素。
  • 调整物体位置。
  • 改变人物动作。
  • 增加或移除局部物体。

外观编辑

外观编辑侧重保持图像内容主体,同时修改风格、材质、颜色或视觉表现。

适用场景包括:

  • 更换衣服颜色。
  • 改变商品材质。
  • 增强图像细节。
  • 调整画面色调。
  • 转换视觉风格。
  • 保留人物身份和主体特征。

ControlNet 条件控制

Qwen-Image-Edit-2509 支持常用 ControlNet 图像条件。

适用场景包括:

  • 关键点控制。
  • 草图控制。
  • 姿态控制。
  • 轮廓控制。
  • 结构参考生成。
  • 草图转精修图。
  • 指定构图生成。

多风格图像生成

Qwen-Image 支持多种艺术风格和视觉风格。

可覆盖:

  • 写实摄影。
  • 动漫风格。
  • 插画风格。
  • 极简设计。
  • 水彩。
  • 油画。
  • 产品海报。
  • 商业广告。
  • 儿童绘本。
  • 科技感信息图。

Qwen-Image 使用入口

千问官网

入口地址:点击查看

Qwen Studio

Qwen Studio 是 Qwen 官方用户入口,可用于聊天、图像理解、图像生成、文档处理等任务,用户可在 Qwen Studio 中选择图像生成相关入口进行创作。

入口地址:Qwen Studio

Qwen GitHub

Qwen-Image 官方代码仓库:点击查看

该仓库包含 Qwen-Image 介绍、更新记录、使用资源和开源许可信息。

Hugging Face

Qwen-Image 模型页面:点击查看

ModelScope

Qwen-Image 也可通过 ModelScope 生态获取和使用,适合中文开发者、研究者和国内模型部署场景。

阿里云百炼

阿里云 百炼 是 Qwen 图像生成与图像编辑模型的 API 调用入口之一。

阿里云通义千问API入口:点击查看

© 版权声明
THE END
喜欢就支持一下吧
分享