ChatGPT Images 2.0概览
ChatGPT Images 2.0 是 OpenAI 在 ChatGPT 中推出的新一代图像生成模型与图像编辑能力。ChatGPT Images 2.0 于 2026年4月21日发布,是 ChatGPT 内的新图像生成模型。OpenAI API 中对应的图像生成模型为 GPT Image 2,模型代码为 gpt-image-2。
ChatGPT Images 2.0信息汇总
| 项目 | 内容 |
|---|---|
| 名称 | ChatGPT Images 2.0 |
| API 模型名称 | GPT Image 2 |
| API 模型代码 | gpt-image-2 |
| 产品类型 | AI 图像生成与图像编辑模型 / ChatGPT 图像生成能力 |
| 开发者 | OpenAI |
| 所属生态 | ChatGPT / OpenAI API |
| 发布时间 | 2026年4月21日 |
| 可用平台 | ChatGPT Web、iOS、Android;OpenAI API |
| ChatGPT 可用范围 | 所有 ChatGPT 计划均可使用 ChatGPT Images 2.0 |
| 付费增强能力 | Images with thinking,面向 Plus、Pro、Business;Enterprise 与 Edu 即将推出 |
| 主要功能 | 文生图、图像编辑、局部编辑、透明背景、复杂文字渲染、多语言文字生成、真实世界知识增强、复杂版式生成 |
| API 入口 | Image API、Responses API |
| 官方发布页 | Introducing ChatGPT Images 2.0 |
| ChatGPT 帮助文档 | Images in ChatGPT |
| API 文档 | GPT Image 2 Model |
ChatGPT Images 2.0概述
ChatGPT Images 2.0 是 OpenAI 面向 ChatGPT 用户推出的新一代图像生成能力。OpenAI 在 ChatGPT Release Notes 中说明,ChatGPT Images 2.0 是 ChatGPT 内的新图像生成模型,并且适用于所有 ChatGPT 计划。
在用户侧,ChatGPT Images 2.0 可用于生成图像、编辑已有图像、添加文字、增加画面细节、生成透明背景,以及通过自然语言描述修改图像。用户可以在 ChatGPT Web、iOS 和 Android 中使用该能力。
在开发者侧,OpenAI API 中对应模型为 GPT Image 2,模型代码为:gpt-image-2,OpenAI API 文档将 GPT Image 2 描述为 OpenAI 的 state-of-the-art image generation model,用于快速、高质量的图像生成和编辑,支持灵活图像尺寸和高保真图像输入。
| 名称 | 所属场景 | 含义 |
|---|---|---|
| ChatGPT Images 2.0 | ChatGPT 产品侧 | ChatGPT 中的新一代图像生成与编辑体验 |
| GPT Image 2 | OpenAI API / 模型侧 | OpenAI 的新一代图像生成模型 |
| gpt-image-2 | API 调用侧 | 开发者调用 GPT Image 2 时使用的模型代码 |
ChatGPT Images 2.0 最新动态
- 2026年4月22日:ChatGPT Images 2.0 迅速登顶 LLM Arena AI 图像生成排行榜。在“文本到图像”等多项核心评测中,以创纪录的 242 分优势断层式领先其他同类模型,标志着 AI 图像生成领域迎来重大跨越。
- 2026年4月21日:OpenAI 正式发布 ChatGPT Images 2.0。官方宣布该模型向所有 ChatGPT 用户(含免费版)开放基础版使用权限,并为付费用户独家推出了带有推理规划能力的“思考模式(Images with Thinking)”。
- 2026年4月16日:OpenAI 通过官方发布说明(Release Notes)提前预热,不仅宣布了新一代图像模型的即将到来,还为全平台推出了全新的“Image Library(图像素材库)”功能,方便用户统一管理生成的视觉内容。
ChatGPT Image 2.0 概述
在生成式 AI 图像领域的竞争白热化(如 Google 推出 Nano Banana 等竞品)的背景下,OpenAI 整合了其在语言大模型上的推理(Reasoning)优势,打造了这款全面超越前代(DALL-E 3 及 GPT-Image-1.5)的视觉基础模型。ChatGPT Image 2.0 的系统知识库已更新至 2025 年 12 月。
与传统的“盲目作画”工具不同,它的核心行业定位是“视觉 Agent”——能够像人类画师一样,在动笔前进行构思、排版甚至利用网络搜索核实事实。
自 2026 年初在第三方平台以 “duct tape” 为名进行秘密盲测以来,它凭借极强的图像控制力赢得了压倒性的口碑,被视为生成式 AI 从“玩具”走向真正“生产力工具”的分水岭。
ChatGPT Image 2.0 历史与版本
- 2025年12月:OpenAI 推出上一代过渡模型 GPT-Image-1.5,主要对色彩表现和基础指令遵循进行了初步优化,为下一代图像模型奠定技术基础。
- 2026年2月:ChatGPT Image 2.0 在知名第三方测试平台 LM Arena AI 上以 “duct tape” 的代号开启大规模早期秘密盲测。
- 2026年4月21日:OpenAI 正式向全球公开发布 ChatGPT Images 2.0,网页端、iOS 和 Android 客户端同步上线,并将基础生成能力下放给免费用户。
- 2026年5月初:GPT-Image-2 的官方 API 全面向开发者开放,允许第三方集成高质量图像生成与精细化编辑功能。
ChatGPT Image 2.0 主要功能
1. 文本生成图像
ChatGPT Images 2.0 支持根据自然语言提示生成图像。用户可以直接要求 ChatGPT 创建图像,也可以在工具菜单中选择 Create image。ChatGPT 可以根据自然语言提示生成原创图像,用户可以快速迭代,要求不同变体、调整构图或尺寸,并探索新的视觉方向。
2. 图像编辑
ChatGPT Images 2.0 支持编辑用户在 ChatGPT 中创建的图像,也支持上传已有图像后进行编辑,用户可通过两种方式编辑图像:
- 使用选择工具选中图像局部区域,然后在聊天中描述修改内容。
- 不使用选择工具,直接在对话面板中描述想要的编辑。
如果用户希望修改应用到特定区域,应在提示词中明确说明。
3. 局部编辑
ChatGPT Images 2.0 支持通过图像选择工具进行局部编辑。用户可以选中图像中的一部分,然后要求 ChatGPT 替换、添加、移除或调整该区域内容。适用场景包括:
- 修改背景。
- 更换物体。
- 添加局部元素。
- 修改人物服装或道具。
- 修复画面局部细节。
- 调整版式中的某一处文字或图形。
4. 添加文字与复杂文字渲染
ChatGPT Images 可以按照精确指令添加文字、增加画面细节,或生成透明背景。OpenAI 发布页和 System Card 均强调,ChatGPT Images 2.0 在图像生成能力上有明显提升,包括更强的世界知识、指令跟随能力,以及生成密集文字等复杂细节的能力。适用场景包括:
- 海报。
- 信息图。
- 漫画分镜。
- 广告物料。
- 教学图解。
- 产品说明图。
- 多语言视觉内容。
5. 多语言图像生成
OpenAI 发布页展示了 ChatGPT Images 2.0 在多语言文字渲染上的能力示例,包括不同语言和文字系统下的图像生成。官方示例涵盖日文、韩文、阿拉伯文、南亚文字、中文、拉丁文字等多种视觉场景。
6. 透明背景
OpenAI Help Center 明确说明,ChatGPT Images 可以按照精确指令生成透明背景。这使其适合用于:
- 图标。
- Logo 草案。
- Sticker。
- 产品素材。
- 叠加式营销图。
- 电商素材。
7. 高保真图像输入
OpenAI API 模型页说明,GPT Image 2 支持 high-fidelity image inputs,即高保真图像输入。这意味着开发者可将图像作为输入,并基于该图像进行高质量编辑或生成。
8. 灵活图像尺寸
OpenAI API 模型页说明,GPT Image 2 支持 flexible image sizes。OpenAI API 图像生成指南也说明,GPT Image 2 支持大量有效分辨率,开发者可通过质量、尺寸、格式和压缩等参数定制输出。
9. 多轮图像编辑
OpenAI API 图像生成指南说明,Responses API 相比 Image API 增加了多轮编辑能力。开发者可以构建对话式、可编辑的图像体验,用户可通过多轮提示逐步修改图像。
10. 与网页搜索结合的图像生成
OpenAI Deployment Safety Hub 的 ChatGPT Images 2.0 System Card 说明,thinking mode 会把推理和工具使用加入图像生成过程,使系统可以整合 live web search data,并把基础提示词发展为经过研究和思考的最终图像。
Images with thinking
Images with thinking 是与 ChatGPT Images 2.0 同时推出的增强能力。
OpenAI 在 Release Notes 和 System Card 中说明,thinking mode 可在图像生成前进行规划和优化。System Card 进一步说明,thinking mode 会把推理和工具使用加入图像生成过程,使系统能够整合实时网页搜索数据、从单个提示词生成多张图像,并利用推理栈将基础提示词转化为更完整、更有研究支撑的最终图像。
ChatGPT ImageS 2.0 价格
- 免费版(Free 计划):目前面向所有注册用户免费开放。免费版用户可以使用 ChatGPT Image 2.0 的基础图像生成功能和常规编辑器修改功能,但受限于基础队列和计算资源。
- 付费版(Plus / Pro / Business 计划):付费订阅用户不仅享有更高的调用额度和优先生成速度,还可以独家解锁核心的“思考模式(Images with Thinking)”。在 ChatGPT Pro 计划中,可使用最大算力的复杂推理生成功能。
- API 开发者定价(Token与尺寸计费):


ChatGPT Images 2.0 入口
- 官网入口:https://chatgpt.com/images/
- ChatGPT Images 可在 Web、iOS 和 Android 上使用
- Image API
- Generations:根据文本提示从零生成图像。
- Edits:使用新提示词修改已有图像,可进行局部或整体修改。
ChatGPT Images 2.0 相关文档汇总
- OpenAI:Introducing ChatGPT Images 2.0
- OpenAI Help Center:Images in ChatGPT
- OpenAI Help Center:ChatGPT Release Notes
- OpenAI API:GPT Image 2 Model
- OpenAI API:Image generation guide
- OpenAI API Pricing
- OpenAI Deployment Safety Hub:ChatGPT Images 2.0 System Card
- OpenAI Help Center:C2PA in ChatGPT Images
- ChatGPT Pricing
- OpenAI Help Center:About ChatGPT Pro tiers
- OpenAI Help Center:Managing billing and seats in ChatGPT Business






