ChatGPT Images 2.0  | AI图像生成

ChatGPT Images 2.0 | AI图像生成

ChatGPT Images 2.0概览

ChatGPT Images 2.0 是 OpenAI 在 ChatGPT 中推出的新一代图像生成模型与图像编辑能力。ChatGPT Images 2.0 于 2026年4月21日发布,是 ChatGPT 内的新图像生成模型。OpenAI API 中对应的图像生成模型为 GPT Image 2,模型代码为 gpt-image-2


ChatGPT Images 2.0信息汇总

项目内容
名称ChatGPT Images 2.0
API 模型名称GPT Image 2
API 模型代码gpt-image-2
产品类型AI 图像生成与图像编辑模型 / ChatGPT 图像生成能力
开发者OpenAI
所属生态ChatGPT / OpenAI API
发布时间2026年4月21日
可用平台ChatGPT Web、iOS、Android;OpenAI API
ChatGPT 可用范围所有 ChatGPT 计划均可使用 ChatGPT Images 2.0
付费增强能力Images with thinking,面向 Plus、Pro、Business;Enterprise 与 Edu 即将推出
主要功能文生图、图像编辑、局部编辑、透明背景、复杂文字渲染、多语言文字生成、真实世界知识增强、复杂版式生成
API 入口Image API、Responses API
官方发布页Introducing ChatGPT Images 2.0
ChatGPT 帮助文档Images in ChatGPT
API 文档GPT Image 2 Model

ChatGPT Images 2.0概述

ChatGPT Images 2.0 是 OpenAI 面向 ChatGPT 用户推出的新一代图像生成能力。OpenAI 在 ChatGPT Release Notes 中说明,ChatGPT Images 2.0 是 ChatGPT 内的新图像生成模型,并且适用于所有 ChatGPT 计划。

在用户侧,ChatGPT Images 2.0 可用于生成图像、编辑已有图像、添加文字、增加画面细节、生成透明背景,以及通过自然语言描述修改图像。用户可以在 ChatGPT Web、iOS 和 Android 中使用该能力。

在开发者侧,OpenAI API 中对应模型为 GPT Image 2,模型代码为:gpt-image-2,OpenAI API 文档将 GPT Image 2 描述为 OpenAI 的 state-of-the-art image generation model,用于快速、高质量的图像生成和编辑,支持灵活图像尺寸和高保真图像输入。

名称所属场景含义
ChatGPT Images 2.0ChatGPT 产品侧ChatGPT 中的新一代图像生成与编辑体验
GPT Image 2OpenAI API / 模型侧OpenAI 的新一代图像生成模型
gpt-image-2API 调用侧开发者调用 GPT Image 2 时使用的模型代码

ChatGPT Images 2.0 最新动态

  • 2026年4月22日:ChatGPT Images 2.0 迅速登顶 LLM Arena AI 图像生成排行榜。在“文本到图像”等多项核心评测中,以创纪录的 242 分优势断层式领先其他同类模型,标志着 AI 图像生成领域迎来重大跨越。
  • 2026年4月21日:OpenAI 正式发布 ChatGPT Images 2.0。官方宣布该模型向所有 ChatGPT 用户(含免费版)开放基础版使用权限,并为付费用户独家推出了带有推理规划能力的“思考模式(Images with Thinking)”。
  • 2026年4月16日:OpenAI 通过官方发布说明(Release Notes)提前预热,不仅宣布了新一代图像模型的即将到来,还为全平台推出了全新的“Image Library(图像素材库)”功能,方便用户统一管理生成的视觉内容。

ChatGPT Image 2.0 概述

在生成式 AI 图像领域的竞争白热化(如 Google 推出 Nano Banana 等竞品)的背景下,OpenAI 整合了其在语言大模型上的推理(Reasoning)优势,打造了这款全面超越前代(DALL-E 3 及 GPT-Image-1.5)的视觉基础模型。ChatGPT Image 2.0 的系统知识库已更新至 2025 年 12 月。

与传统的“盲目作画”工具不同,它的核心行业定位是“视觉 Agent”——能够像人类画师一样,在动笔前进行构思、排版甚至利用网络搜索核实事实。

自 2026 年初在第三方平台以 “duct tape” 为名进行秘密盲测以来,它凭借极强的图像控制力赢得了压倒性的口碑,被视为生成式 AI 从“玩具”走向真正“生产力工具”的分水岭。

ChatGPT Image 2.0 历史与版本

  • 2025年12月:OpenAI 推出上一代过渡模型 GPT-Image-1.5,主要对色彩表现和基础指令遵循进行了初步优化,为下一代图像模型奠定技术基础。
  • 2026年2月:ChatGPT Image 2.0 在知名第三方测试平台 LM Arena AI 上以 “duct tape” 的代号开启大规模早期秘密盲测。
  • 2026年4月21日:OpenAI 正式向全球公开发布 ChatGPT Images 2.0,网页端、iOS 和 Android 客户端同步上线,并将基础生成能力下放给免费用户。
  • 2026年5月初:GPT-Image-2 的官方 API 全面向开发者开放,允许第三方集成高质量图像生成与精细化编辑功能。

ChatGPT Image 2.0 主要功能

1. 文本生成图像

ChatGPT Images 2.0 支持根据自然语言提示生成图像。用户可以直接要求 ChatGPT 创建图像,也可以在工具菜单中选择 Create image。ChatGPT 可以根据自然语言提示生成原创图像,用户可以快速迭代,要求不同变体、调整构图或尺寸,并探索新的视觉方向。

2. 图像编辑

ChatGPT Images 2.0 支持编辑用户在 ChatGPT 中创建的图像,也支持上传已有图像后进行编辑,用户可通过两种方式编辑图像:

  1. 使用选择工具选中图像局部区域,然后在聊天中描述修改内容。
  2. 不使用选择工具,直接在对话面板中描述想要的编辑。

如果用户希望修改应用到特定区域,应在提示词中明确说明。

3. 局部编辑

ChatGPT Images 2.0 支持通过图像选择工具进行局部编辑。用户可以选中图像中的一部分,然后要求 ChatGPT 替换、添加、移除或调整该区域内容。适用场景包括:

  • 修改背景。
  • 更换物体。
  • 添加局部元素。
  • 修改人物服装或道具。
  • 修复画面局部细节。
  • 调整版式中的某一处文字或图形。

4. 添加文字与复杂文字渲染

ChatGPT Images 可以按照精确指令添加文字、增加画面细节,或生成透明背景。OpenAI 发布页和 System Card 均强调,ChatGPT Images 2.0 在图像生成能力上有明显提升,包括更强的世界知识、指令跟随能力,以及生成密集文字等复杂细节的能力。适用场景包括:

  • 海报。
  • 信息图。
  • 漫画分镜。
  • 广告物料。
  • 教学图解。
  • 产品说明图。
  • 多语言视觉内容。

5. 多语言图像生成

OpenAI 发布页展示了 ChatGPT Images 2.0 在多语言文字渲染上的能力示例,包括不同语言和文字系统下的图像生成。官方示例涵盖日文、韩文、阿拉伯文、南亚文字、中文、拉丁文字等多种视觉场景。

6. 透明背景

OpenAI Help Center 明确说明,ChatGPT Images 可以按照精确指令生成透明背景。这使其适合用于:

  • 图标。
  • Logo 草案。
  • Sticker。
  • 产品素材。
  • 叠加式营销图。
  • 电商素材。

7. 高保真图像输入

OpenAI API 模型页说明,GPT Image 2 支持 high-fidelity image inputs,即高保真图像输入。这意味着开发者可将图像作为输入,并基于该图像进行高质量编辑或生成。

8. 灵活图像尺寸

OpenAI API 模型页说明,GPT Image 2 支持 flexible image sizes。OpenAI API 图像生成指南也说明,GPT Image 2 支持大量有效分辨率,开发者可通过质量、尺寸、格式和压缩等参数定制输出。

9. 多轮图像编辑

OpenAI API 图像生成指南说明,Responses API 相比 Image API 增加了多轮编辑能力。开发者可以构建对话式、可编辑的图像体验,用户可通过多轮提示逐步修改图像。

10. 与网页搜索结合的图像生成

OpenAI Deployment Safety Hub 的 ChatGPT Images 2.0 System Card 说明,thinking mode 会把推理和工具使用加入图像生成过程,使系统可以整合 live web search data,并把基础提示词发展为经过研究和思考的最终图像。

Images with thinking

Images with thinking 是与 ChatGPT Images 2.0 同时推出的增强能力。

OpenAI 在 Release Notes 和 System Card 中说明,thinking mode 可在图像生成前进行规划和优化。System Card 进一步说明,thinking mode 会把推理和工具使用加入图像生成过程,使系统能够整合实时网页搜索数据、从单个提示词生成多张图像,并利用推理栈将基础提示词转化为更完整、更有研究支撑的最终图像。

ChatGPT ImageS 2.0 价格

  • 免费版(Free 计划):目前面向所有注册用户免费开放。免费版用户可以使用 ChatGPT Image 2.0 的基础图像生成功能和常规编辑器修改功能,但受限于基础队列和计算资源。
  • 付费版(Plus / Pro / Business 计划):付费订阅用户不仅享有更高的调用额度和优先生成速度,还可以独家解锁核心的“思考模式(Images with Thinking)”。在 ChatGPT Pro 计划中,可使用最大算力的复杂推理生成功能。
  • API 开发者定价(Token与尺寸计费)
ChatGPT Image 2.0 价格
ChatGPT Image 2.0 价格

ChatGPT Images 2.0 入口

  • 官网入口https://chatgpt.com/images/
  • ChatGPT Images 可在 Web、iOS 和 Android 上使用
  • Image API
    • Generations:根据文本提示从零生成图像。
    • Edits:使用新提示词修改已有图像,可进行局部或整体修改。

ChatGPT Images 2.0 相关文档汇总

© 版权声明
THE END
喜欢就支持一下吧
分享