Qwen-Image 信息概览
| 项目 | 内容 |
|---|---|
| 名称 | Qwen-Image |
| 中文生态名称 | 通义千问 / Qwen |
| 产品类型 | AI 图像生成与图像编辑模型系列 |
| 开发者 | Qwen Team / Alibaba Cloud |
| 所属生态 | 通义千问、Qwen、Qwen Studio、阿里云 Model Studio、ModelScope、阿里云百炼 |
| 首次发布时间 | 2025年8月4日 |
| 基础模型规模 | 20B |
| 架构类型 | MMDiT |
| 主要模型 | Qwen-Image、Qwen-Image-Edit、Qwen-Image-Edit-2509、Qwen-Image-Edit-2511、Qwen-Image-2512、Qwen-Image 2.0 |
| API 模型名称 | qwen-image、qwen-image-plus、qwen-image-max、qwen-image-2.0、qwen-image-2.0-pro、qwen-image-edit、qwen-image-edit-plus、qwen-image-edit-max |
| 主要功能 | 文生图、图像编辑、复杂文字渲染、中英文文字生成、海报生成、PPT / 信息图生成、风格迁移、对象增删、局部修改、图像文字编辑 |
| 开源许可 | Apache-2.0 |
| 官方体验入口 | 通义千问 |
| 官方代码仓库 | QwenLM/Qwen-Image |
| 官方博客 | Qwen Blog |
| API 入口 | Alibaba Cloud Model Studio |
Qwen-Image 概述
Qwen-Image 是 Qwen 系列中的图像生成与图像编辑模型族,面向文本生成图像、图像编辑、复杂文字渲染、海报生成、PPT 生成、漫画生成、信息图生成和多风格视觉创作等场景。
Qwen-Image 的核心特征是对图像中文字内容的处理能力,尤其强调中文与英文的文字生成、排版控制、多行文本、段落语义和细粒度视觉细节。相较于许多通用文生图模型,Qwen-Image 更突出“图文一体”的生成能力,适合包含标题、副标题、说明文字、版式结构和复杂排版的视觉内容。
在产品入口上,普通用户可以通过 Qwen Studio 使用图像生成能力;开发者可以通过 Alibaba Cloud Model Studio 调用 Qwen 图像生成和图像编辑模型;研究者和工程用户也可以通过 GitHub、Hugging Face、ModelScope 等渠道获取模型、代码或权重信息。
Qwen-Image 名称与定位
Qwen-Image 既指最初发布的 20B 图像基础模型,也常用于泛指 Qwen 生态中的图像生成与编辑模型系列。
在不同场景中,相关名称含义如下:
| 名称 | 所属场景 | 含义 |
|---|---|---|
| Qwen-Image | 基础模型 / 开源模型 | 20B MMDiT 图像基础模型,重点面向复杂文字渲染和图像生成 |
| Qwen-Image-Edit | 图像编辑模型 | 基于 Qwen-Image 的图像编辑版本 |
| Qwen-Image-Edit-2509 | 图像编辑升级版本 | 增强多图编辑、ControlNet 条件和编辑能力 |
| Qwen-Image-Edit-2511 | 图像编辑升级版本 | 强调一致性提升 |
| Qwen-Image-2512 | 图像生成升级版本 | 强调更真实的人像、更自然的纹理和更强文字渲染 |
| Qwen-Image 2.0 | 商业 API / 平台模型 | 面向专业信息图、图文生成和生产级创作的升级模型 |
| Qwen Studio | 用户产品入口 | 面向普通用户的 Qwen 官方交互平台 |
| Model Studio | API 平台入口 | 阿里云面向开发者和企业的模型调用平台 |
Qwen-Image 的产品定位偏向“图文生成”和“可控视觉内容生产”。它不只是生成艺术图像,也面向更实用的图像任务,例如海报、PPT、信息图、广告物料、漫画分镜、界面草图和带文字的商业视觉素材。
Qwen-Image 发展历史
2025年8月:Qwen-Image 发布
2025年8月4日,Qwen-Image 发布。
首个 Qwen-Image 是 20B MMDiT 图像基础模型,重点能力包括复杂文字渲染、精准图像编辑和多风格图像生成。模型支持生成包含中文、英文、多行文字、段落语义和细节排版的图像内容。
Qwen-Image 同时在 GitHub、Hugging Face、ModelScope 等渠道开放,并可在 Qwen Chat / Qwen Studio 中选择 Image Generation 体验。
2025年8月:Qwen-Image 接入 Qwen Studio 与 ComfyUI
2025年8月5日,Qwen-Image 接入 Qwen Chat / Qwen Studio 的 Image Generation 入口。
同日,Qwen-Image 也获得 ComfyUI 原生支持,方便工作流用户在节点式图像生成环境中使用。
2025年8月:Qwen-Image-Edit 发布
2025年8月18日,Qwen-Image-Edit 发布。
Qwen-Image-Edit 是 Qwen-Image 的图像编辑版本,建立在 20B Qwen-Image 模型之上,将 Qwen-Image 的文字渲染能力扩展到图像编辑任务中。它同时利用视觉语义控制和视觉外观控制,支持语义编辑、外观编辑和精确文字编辑。
2025年9月:Qwen-Image-Edit-2509 发布
2025年9月22日,Qwen-Image-Edit-2509 发布。
该版本增加对常用 ControlNet 图像条件的原生支持,例如关键点控制和草图控制,并强化图像编辑场景中的可控性。
2025年12月:Qwen-Image-Edit-2511 发布
2025年12月22日,Qwen-Image-Edit-2511 发布。
该版本定位为 Qwen-Image-Edit-2509 的增强版本,重点提升图像编辑中的一致性表现。
2025年12月:Qwen-Image-2512 发布
2025年12月30日,Qwen-Image-2512 发布。
该版本强调更真实的人像、更细腻的自然纹理和更强文字渲染能力,重点减少 AI 生成感,提升面部、年龄、景观、水体、毛发、材质和图文组合表现。
2026年2月:Qwen-Image 2.0 发布
2026年2月9日,Qwen-Image 2.0 发布。
Qwen-Image 2.0 面向专业信息图、精致排版、视觉表达和生产级图文生成场景。阿里云 Model Studio 后续提供 qwen-image-2.0 和 qwen-image-2.0-pro 等模型调用入口。
2026年3月:Qwen-Image 2.0 API 快照
阿里云 Model Studio 文档列出 qwen-image-2.0-2026-03-03 和 qwen-image-2.0-pro-2026-03-03 模型快照。
qwen-image-2.0 当前能力与 qwen-image-2.0-2026-03-03 相同;qwen-image-2.0-pro 当前能力与 qwen-image-2.0-pro-2026-03-03 相同。
Qwen-Image 模型版本 / 产品版本
Qwen-Image
Qwen-Image 是最初发布的 20B MMDiT 图像基础模型。
主要特点包括:
- 20B 参数规模。
- MMDiT 架构。
- 复杂文字渲染。
- 中文与英文文字生成。
- 多行文本和段落级语义处理。
- 专业排版能力。
- 图像生成与图像编辑能力统一。
- 原生 2K 分辨率支持。
- 适用于海报、PPT、漫画、信息图和多风格图像生成。
Qwen-Image-Edit
Qwen-Image-Edit 是 Qwen-Image 的图像编辑版本。
主要能力包括:
- 精确文字编辑。
- 语义编辑。
- 外观编辑。
- 图像局部修改。
- 保留原图视觉特征。
- 基于视觉语义和视觉外观的双通路控制。
- 适用于图像中文字替换、风格迁移、对象调整和细节修改。
Qwen-Image-Edit-2509
Qwen-Image-Edit-2509 是 Qwen-Image-Edit 的 2025 年 9 月升级版本。
主要特点包括:
- 增强图像编辑控制。
- 支持常用 ControlNet 图像条件。
- 支持关键点控制。
- 支持草图控制。
- 改善结构可控生成。
- 适合姿态控制、轮廓控制、草图转图和复杂编辑任务。
Qwen-Image-Edit-2511
Qwen-Image-Edit-2511 是 2025 年 12 月发布的图像编辑升级版本。
主要特点包括:
- 提升图像编辑一致性。
- 改善主体保持。
- 改善编辑前后视觉连贯性。
- 适合人物、商品、角色和多轮编辑任务。
Qwen-Image-2512
Qwen-Image-2512 是 2025 年 12 月发布的图像生成升级版本。
主要特点包括:
- 更真实的人像表现。
- 减少 AI 生成感。
- 更丰富的面部和年龄细节。
- 更细腻的自然纹理。
- 更锐利的景观、水体、毛发和材质表现。
- 更强文字渲染能力。
- 更好的图文版式组合。
Qwen-Image 2.0
Qwen-Image 2.0 是 Qwen-Image 系列的 2.0 版本,面向更专业的图像生成、图文排版和视觉生产场景。
阿里云 Model Studio 中的相关模型包括:
- qwen-image-2.0
- qwen-image-2.0-2026-03-03
- qwen-image-2.0-pro
- qwen-image-2.0-pro-2026-03-03
主要定位包括:
- 专业信息图生成。
- 精致图文排版。
- 商业海报生成。
- 高质量图像生成。
- 生产级视觉素材生成。
- 面向 API 的稳定模型调用。
Qwen-Image 主要功能
文生图
Qwen-Image 支持根据文本提示生成图像,覆盖写实、插画、动漫、设计稿、海报、信息图、PPT、漫画和多种艺术风格。
其优势集中在带文字的图像生成场景,尤其适合标题、副标题、说明文字、标签、段落和版式较复杂的视觉内容。
复杂文字渲染
复杂文字渲染是 Qwen-Image 的核心能力。
可覆盖的场景包括:
- 中文标题。
- 英文标题。
- 多行文字。
- 段落级内容。
- 海报文案。
- PPT 页面文字。
- 漫画对白。
- 信息图标注。
- 商品卖点文字。
- UI 文案。
- 细粒度排版元素。
中文图像文字生成
Qwen-Image 对中文文字生成进行了重点优化,适合中文海报、中文信息图、中文电商图、中文宣传图和中文排版设计。
典型场景包括:
- 中文节日海报。
- 中文课程封面。
- 中文品牌广告。
- 中文菜单。
- 中文产品说明图。
- 中文漫画分镜。
- 中文社交媒体封面。
英文图像文字生成
Qwen-Image 同样支持英文图像文字生成,适合英文海报、英文广告、英文 PPT、英文信息图和国际化视觉素材。
专业排版生成
Qwen-Image 可用于生成具备版式结构的图像,例如:
- PPT 页面。
- 产品介绍页。
- 信息图。
- 商业海报。
- 活动海报。
- 教育图解。
- 漫画页面。
- 图文混排视觉稿。
图像编辑
Qwen 图像编辑模型支持复杂图文编辑任务,包括:
- 中英文文字编辑。
- 调色。
- 细节增强。
- 风格迁移。
- 添加对象。
- 删除对象。
- 改变对象位置。
- 修改人物动作。
- 更换背景。
- 改变服装或物体外观。
精确文字编辑
Qwen-Image-Edit 可对已有图像中的文字进行修改,适用于海报、广告图、商品图、PPT 页面和视觉模板的二次编辑。
典型任务包括:
- 替换图中英文短语。
- 替换中文标题。
- 修改商品图标签。
- 修改海报日期。
- 调整图中文字内容。
- 保留原有版式和视觉风格。
语义编辑
Qwen-Image-Edit 支持基于语义指令修改图像,例如:
- 将人物改为站立姿势。
- 改变背景地点。
- 将照片变成卡通头像。
- 移除画面中不需要的元素。
- 调整物体位置。
- 改变人物动作。
- 增加或移除局部物体。
外观编辑
外观编辑侧重保持图像内容主体,同时修改风格、材质、颜色或视觉表现。
适用场景包括:
- 更换衣服颜色。
- 改变商品材质。
- 增强图像细节。
- 调整画面色调。
- 转换视觉风格。
- 保留人物身份和主体特征。
ControlNet 条件控制
Qwen-Image-Edit-2509 支持常用 ControlNet 图像条件。
适用场景包括:
- 关键点控制。
- 草图控制。
- 姿态控制。
- 轮廓控制。
- 结构参考生成。
- 草图转精修图。
- 指定构图生成。
多风格图像生成
Qwen-Image 支持多种艺术风格和视觉风格。
可覆盖:
- 写实摄影。
- 动漫风格。
- 插画风格。
- 极简设计。
- 水彩。
- 油画。
- 产品海报。
- 商业广告。
- 儿童绘本。
- 科技感信息图。
Qwen-Image 使用入口
千问官网
入口地址:点击查看
Qwen Studio
Qwen Studio 是 Qwen 官方用户入口,可用于聊天、图像理解、图像生成、文档处理等任务,用户可在 Qwen Studio 中选择图像生成相关入口进行创作。
入口地址:Qwen Studio
Qwen GitHub
Qwen-Image 官方代码仓库:点击查看
该仓库包含 Qwen-Image 介绍、更新记录、使用资源和开源许可信息。
Hugging Face
Qwen-Image 模型页面:点击查看
ModelScope
Qwen-Image 也可通过 ModelScope 生态获取和使用,适合中文开发者、研究者和国内模型部署场景。
阿里云百炼
阿里云 百炼 是 Qwen 图像生成与图像编辑模型的 API 调用入口之一。
阿里云通义千问API入口:点击查看






