OpenAI发布GPT-5，宣称在智能、安全与实用性上实现重大飞跃

2025年8月7日，人工智能研究公司OpenAI正式发布了其备受瞩目的新一代模型——GPT-5。据称在编码、数学、写作、健康及视觉感知等多个维度实现了最前沿的性能，标志着AI能力的一次重大飞跃。

根据官方介绍，GPT-5并非单一模型，而是一个统一的智能系统。该系统内置一个实时智能调度器，能根据用户请求的复杂度和意图，自动在高效的基础模型和专为难题设计的深度推理模型（GPT-5 thinking）之间进行切换。这一设计旨在兼顾响应速度与回答的深度。

GPT-5核心能力提升

OpenAI方面表示，GPT-5在多个关键应用领域取得了显著进步：

编码能力： GPT-5被誉为该公司迄今最强的编码模型，尤其擅长复杂前端生成和大型代码库调试。官方发布的示例显示，它能仅凭单个提示，创造出包含交互、美学和功能性的完整应用。
创意写作： 为展示其写作能力的提升，官方提供了一个GPT-5与前代模型GPT-4o的诗歌创作对比。分析指出，GPT-5的诗歌在情感深度、意象构建和文学隐喻方面表现更为出色，能够创作出更具艺术感染力的作品。
健康领域： 该模型在处理健康相关问题上表现出更高的准确性和同理心。它被设计成一个“主动的思考伙伴”，能够主动提出问题并提示潜在风险，同时根据用户的具体情况提供更安全、更有用的信息。官方强调，该功能旨在辅助用户，但不能取代专业医疗人员。

GPT-5性能与可靠性

在性能评测方面，OpenAI公布了一系列基准测试数据，显示GPT-5在多个学术和行业标准上取得了领先地位，尤其在AIME数学竞赛、SWE-bench软件工程测试以及MMMU多模态理解等高难度基准上刷新了纪录。

在可靠性与安全性方面，公告强调GPT-5做出了多项改进：

减少幻觉： 据称，GPT-5产生事实错误的概率显著低于前代模型，在启用深度思考模式时，错误率比o3模型降低了约80%。
提升诚实度： 该模型经过训练，能更好地识别并承认其能力边界。在一项测试中，当被要求处理不存在的图像时，GPT-5仅有9%的情况会自信地“捏造”答案，而o3模型则高达86.7%。
优化交互安全： GPT-5引入了“安全补全”训练范式，使其在面对潜在的敏感或双重用途问题时，能在遵守安全边界的前提下提供更有帮助、无害化的回答，而非简单地拒绝。

GPT-5 Pro版本与用户体验

此次发布还包括一个更强大的版本——GPT-5 Pro。该版本专为应对最复杂、最具挑战性的任务而设计，通过更长的计算时间提供更全面、更精准的答案。在外部专家评估中，GPT-5 Pro的回答在67.8%的情况下优于标准版GPT-5。

此外，OpenAI还致力于改善用户体验，减少了模型的“过度附和”（sycophancy）行为，使其对话风格更自然、更具深度。同时，推出了四种新的预设“人格”（如Cynic、Listener等）供用户选择，以满足个性化的交流需求。

GPT-5部署与访问

根据发布计划，GPT-5将成为ChatGPT的新默认模型，逐步向所有用户（包括免费版、Plus、Pro和团队版）推出。不同级别的用户将享有不同的使用额度。Pro订阅者除了拥有更高的使用限额外，还将独家获得使用GPT-5 Pro的权限。当免费用户达到使用上限后，系统将自动切换至一个轻量级的GPT-5 mini模型。

文章版权归作者所有，未经允许请勿转载。

THE END