ChatGPT Images 2.0概览

ChatGPT Images 2.0 是 OpenAI 在 ChatGPT 中推出的新一代图像生成模型与图像编辑能力。ChatGPT Images 2.0 于 2026年4月21日发布，是 ChatGPT 内的新图像生成模型。OpenAI API 中对应的图像生成模型为 GPT Image 2，模型代码为 gpt-image-2。

ChatGPT Images 2.0信息汇总

项目	内容
名称	ChatGPT Images 2.0
API 模型名称	GPT Image 2
API 模型代码	`gpt-image-2`
产品类型	AI 图像生成与图像编辑模型 / ChatGPT 图像生成能力
开发者	OpenAI
所属生态	ChatGPT / OpenAI API
发布时间	2026年4月21日
可用平台	ChatGPT Web、iOS、Android；OpenAI API
ChatGPT 可用范围	所有 ChatGPT 计划均可使用 ChatGPT Images 2.0
付费增强能力	Images with thinking，面向 Plus、Pro、Business；Enterprise 与 Edu 即将推出
主要功能	文生图、图像编辑、局部编辑、透明背景、复杂文字渲染、多语言文字生成、真实世界知识增强、复杂版式生成
API 入口	Image API、Responses API
官方发布页	Introducing ChatGPT Images 2.0
ChatGPT 帮助文档	Images in ChatGPT
API 文档	GPT Image 2 Model

ChatGPT Images 2.0概述

ChatGPT Images 2.0 是 OpenAI 面向 ChatGPT 用户推出的新一代图像生成能力。OpenAI 在 ChatGPT Release Notes 中说明，ChatGPT Images 2.0 是 ChatGPT 内的新图像生成模型，并且适用于所有 ChatGPT 计划。

在用户侧，ChatGPT Images 2.0 可用于生成图像、编辑已有图像、添加文字、增加画面细节、生成透明背景，以及通过自然语言描述修改图像。用户可以在 ChatGPT Web、iOS 和 Android 中使用该能力。

在开发者侧，OpenAI API 中对应模型为 GPT Image 2，模型代码为：gpt-image-2，OpenAI API 文档将 GPT Image 2 描述为 OpenAI 的 state-of-the-art image generation model，用于快速、高质量的图像生成和编辑，支持灵活图像尺寸和高保真图像输入。

名称	所属场景	含义
ChatGPT Images 2.0	ChatGPT 产品侧	ChatGPT 中的新一代图像生成与编辑体验
GPT Image 2	OpenAI API / 模型侧	OpenAI 的新一代图像生成模型
gpt-image-2	API 调用侧	开发者调用 GPT Image 2 时使用的模型代码

ChatGPT Images 2.0 最新动态

2026年4月22日：ChatGPT Images 2.0 迅速登顶 LLM Arena AI 图像生成排行榜。在“文本到图像”等多项核心评测中，以创纪录的 242 分优势断层式领先其他同类模型，标志着 AI 图像生成领域迎来重大跨越。
2026年4月21日：OpenAI 正式发布 ChatGPT Images 2.0。官方宣布该模型向所有 ChatGPT 用户（含免费版）开放基础版使用权限，并为付费用户独家推出了带有推理规划能力的“思考模式（Images with Thinking）”。
2026年4月16日：OpenAI 通过官方发布说明（Release Notes）提前预热，不仅宣布了新一代图像模型的即将到来，还为全平台推出了全新的“Image Library（图像素材库）”功能，方便用户统一管理生成的视觉内容。

ChatGPT Image 2.0 概述

在生成式 AI 图像领域的竞争白热化（如 Google 推出 Nano Banana 等竞品）的背景下，OpenAI 整合了其在语言大模型上的推理（Reasoning）优势，打造了这款全面超越前代（DALL-E 3 及 GPT-Image-1.5）的视觉基础模型。ChatGPT Image 2.0 的系统知识库已更新至 2025 年 12 月。

与传统的“盲目作画”工具不同，它的核心行业定位是“视觉 Agent”——能够像人类画师一样，在动笔前进行构思、排版甚至利用网络搜索核实事实。

自 2026 年初在第三方平台以 “duct tape” 为名进行秘密盲测以来，它凭借极强的图像控制力赢得了压倒性的口碑，被视为生成式 AI 从“玩具”走向真正“生产力工具”的分水岭。

ChatGPT Image 2.0 历史与版本

2025年12月：OpenAI 推出上一代过渡模型 GPT-Image-1.5，主要对色彩表现和基础指令遵循进行了初步优化，为下一代图像模型奠定技术基础。
2026年2月：ChatGPT Image 2.0 在知名第三方测试平台 LM Arena AI 上以 “duct tape” 的代号开启大规模早期秘密盲测。
2026年4月21日：OpenAI 正式向全球公开发布 ChatGPT Images 2.0，网页端、iOS 和 Android 客户端同步上线，并将基础生成能力下放给免费用户。
2026年5月初：GPT-Image-2 的官方 API 全面向开发者开放，允许第三方集成高质量图像生成与精细化编辑功能。

ChatGPT Image 2.0 主要功能

1. 文本生成图像

ChatGPT Images 2.0 支持根据自然语言提示生成图像。用户可以直接要求 ChatGPT 创建图像，也可以在工具菜单中选择 Create image。ChatGPT 可以根据自然语言提示生成原创图像，用户可以快速迭代，要求不同变体、调整构图或尺寸，并探索新的视觉方向。

2. 图像编辑

ChatGPT Images 2.0 支持编辑用户在 ChatGPT 中创建的图像，也支持上传已有图像后进行编辑，用户可通过两种方式编辑图像：

使用选择工具选中图像局部区域，然后在聊天中描述修改内容。
不使用选择工具，直接在对话面板中描述想要的编辑。

如果用户希望修改应用到特定区域，应在提示词中明确说明。

3. 局部编辑

ChatGPT Images 2.0 支持通过图像选择工具进行局部编辑。用户可以选中图像中的一部分，然后要求 ChatGPT 替换、添加、移除或调整该区域内容。适用场景包括：

修改背景。
更换物体。
添加局部元素。
修改人物服装或道具。
修复画面局部细节。
调整版式中的某一处文字或图形。

4. 添加文字与复杂文字渲染

ChatGPT Images 可以按照精确指令添加文字、增加画面细节，或生成透明背景。OpenAI 发布页和 System Card 均强调，ChatGPT Images 2.0 在图像生成能力上有明显提升，包括更强的世界知识、指令跟随能力，以及生成密集文字等复杂细节的能力。适用场景包括：

海报。
信息图。
漫画分镜。
广告物料。
教学图解。
产品说明图。
多语言视觉内容。

5. 多语言图像生成

OpenAI 发布页展示了 ChatGPT Images 2.0 在多语言文字渲染上的能力示例，包括不同语言和文字系统下的图像生成。官方示例涵盖日文、韩文、阿拉伯文、南亚文字、中文、拉丁文字等多种视觉场景。

6. 透明背景

OpenAI Help Center 明确说明，ChatGPT Images 可以按照精确指令生成透明背景。这使其适合用于：

图标。
Logo 草案。
Sticker。
产品素材。
叠加式营销图。
电商素材。

7. 高保真图像输入

OpenAI API 模型页说明，GPT Image 2 支持 high-fidelity image inputs，即高保真图像输入。这意味着开发者可将图像作为输入，并基于该图像进行高质量编辑或生成。

8. 灵活图像尺寸

OpenAI API 模型页说明，GPT Image 2 支持 flexible image sizes。OpenAI API 图像生成指南也说明，GPT Image 2 支持大量有效分辨率，开发者可通过质量、尺寸、格式和压缩等参数定制输出。

9. 多轮图像编辑

OpenAI API 图像生成指南说明，Responses API 相比 Image API 增加了多轮编辑能力。开发者可以构建对话式、可编辑的图像体验，用户可通过多轮提示逐步修改图像。

10. 与网页搜索结合的图像生成

OpenAI Deployment Safety Hub 的 ChatGPT Images 2.0 System Card 说明，thinking mode 会把推理和工具使用加入图像生成过程，使系统可以整合 live web search data，并把基础提示词发展为经过研究和思考的最终图像。

Images with thinking

Images with thinking 是与 ChatGPT Images 2.0 同时推出的增强能力。

OpenAI 在 Release Notes 和 System Card 中说明，thinking mode 可在图像生成前进行规划和优化。System Card 进一步说明，thinking mode 会把推理和工具使用加入图像生成过程，使系统能够整合实时网页搜索数据、从单个提示词生成多张图像，并利用推理栈将基础提示词转化为更完整、更有研究支撑的最终图像。

ChatGPT ImageS 2.0 价格

免费版（Free 计划）：目前面向所有注册用户免费开放。免费版用户可以使用 ChatGPT Image 2.0 的基础图像生成功能和常规编辑器修改功能，但受限于基础队列和计算资源。
付费版（Plus / Pro / Business 计划）：付费订阅用户不仅享有更高的调用额度和优先生成速度，还可以独家解锁核心的“思考模式（Images with Thinking）”。在 ChatGPT Pro 计划中，可使用最大算力的复杂推理生成功能。
API 开发者定价（Token与尺寸计费）：