OpenAI正式发布GPT-5

OpenAI 已推出全新旗舰人工智能模型 GPT-5,该模型将为公司下一代 ChatGPT 提供技术支持。
于周四发布的 GPT-5 是 OpenAI 的首个 “统一” 人工智能模型,它融合了 o 系列模型的推理能力与 GPT 系列的快速响应优势。这款下一代模型标志着 ChatGPT 及其开发者 OpenAI 迈入新纪元,也彰显了 OpenAI 更宏大的野心 —— 开发更接近智能代理而非聊天的人工智能系统。
如果说 GPT-4 让人工智能聊天机器人能够对各类问题给出智能回应,那么 GPT-5 则让 ChatGPT 能够代表用户完成多种任务,例如生成软件应用、管理用户日程或创建研究简报。
借助 GPT-5,OpenAI 还致力于让 ChatGPT 更易于使用。GPT-5 配备了实时路由机制,无需用户手动选择设置,就能自主决定如何提供最佳答案 —— 无论是快速回应用户问题,还是花更多时间 “思考” 答案。

在记者简报会上,OpenAI 首席执行官山姆・奥特曼称 GPT-5 是 “世界上最出色的模型”,并表示它代表着公司在开发 “能在大多数高经济价值工作中超越人类” 的人工智能(即人工通用智能,AGI)道路上迈出了 “重要一步”。
“在历史上任何时期,像 GPT-5 这样的技术都几乎是无法想象的,” 奥特曼说。
从周四开始,GPT-5 将作为默认模型向所有 ChatGPT 免费用户开放。OpenAI 负责 ChatGPT 的副总裁尼克・特利表示,这是公司首次让免费用户接触到人工智能推理模型(此前,这类更先进的模型仅对付费用户开放)。
“这只是我为践行使命而感到兴奋的方式之一,确保这些技术真正惠及大众,” 特利在谈及这一决定时说,他提到了 OpenAI 长期以来的使命 —— 让尽可能多的人接触到先进的人工智能。
外界对 GPT-5 的期待极高,它是自 2022 年 ChatGPT 让 OpenAI 声名鹊起以来,该公司最受期待的产品发布之一。据该公司称,从那以后,ChatGPT 已成长为全球最受欢迎的消费级产品之一,每周用户超过 7 亿 —— 接近全球人口的 10%。
许多人将 GPT-5 视为人工智能整体发展的风向标,硅谷对该模型的反响可能会对大型科技公司、华尔街以及监管科技的政策制定者产生深远影响。这些利益相关方正密切关注 GPT-5 是否能像其前代产品 GPT-4 那样,在人工智能能力上实现重大飞跃,打破人们对软件功能的固有预期。
GPT-5 略胜竞争对手一筹
OpenAI 称,GPT-5 在多个领域达到了最先进水平,在关键基准测试中略优于 Anthropic、谷歌 DeepMind 和埃隆・马斯克的 xAI 等公司的顶尖人工智能模型。不过,在其他一些领域,GPT-5 的表现略逊于前沿人工智能模型。
该公司表示,GPT-5 在编程领域展现出前沿水平;奥特曼称,该模型尤其擅长按需生成完整的软件应用,也就是人们所说的 “氛围编程”。
在 SWE-bench Verified(一项基于 GitHub 真实编程任务的测试)中,GPT-5 首次尝试的得分达到 74.9%。这意味着 GPT-5 略优于 Anthropic 最新的 Claude Opus 4.1 模型(得分 74.5%)和谷歌 DeepMind 的 Gemini 2.5 Pro 模型(得分 59.6%)。
在 “人类终极考试”(一项衡量人工智能模型在数学、人文和自然科学领域表现的高难度测试)中,具备扩展推理能力的 GPT-5 版本(GPT-5 Pro)在使用工具的情况下得分 42%。这略低于 xAI 的 Grok 4 Heavy 模型,后者在该测试中得分 44.4%。

OpenAI 表示,GPT-5 在回答健康相关问题方面表现更出色。在衡量人工智能模型健康领域回应准确性的测试 “HealthBench Hard Hallucinations” 中,OpenAI 称 GPT-5(启用思考功能时)的幻觉率仅为 1.6%。这远低于该公司此前的 GPT-4o 和 o3 模型,后两者的得分分别为 12.9% 和 15.8%。
尽管人工智能聊天机器人并非医疗专业人员,但数百万用户正借助它们获取健康建议。针对这一现象,该公司表示,GPT-5 会更主动地提示潜在的健康问题,并帮助用户解读医疗检查结果。
此外,OpenAI 称,在创意设计、写作等更难衡量的主观领域,GPT-5 也优于其他人工智能模型。特利表示,在创意任务中,GPT-5 的回应更自然,且展现出 “更好的品味”。
“这款模型的‘氛围’真的很棒,” 特利说。
GPT-5 也比 OpenAI 之前的模型更准确,该公司称,与 o 系列模型相比,GPT-5 的幻觉现象(即人工智能模型编造信息的倾向)大幅减少。此前,在 OpenAI 最新的人工智能推理模型(如 o3)中,幻觉问题似乎愈发严重,而该公司此前表示尚未完全弄清楚原因。
在对 ChatGPT 提示词的回应中,OpenAI 发现 GPT-5(启用思考功能时)产生幻觉并给出错误信息的概率为 4.8%。这较 o3 和 GPT-4o 有显著降低,后两者在测试中的幻觉率分别为 22% 和 20.6%。
在衡量人工智能模型完成模拟在线任务的代理能力基准测试 Tau-bench 中,GPT-5 的表现好坏参半。在测试人工智能浏览航空公司网站能力的部分,GPT-5 得分 63.5%,略低于 o3 模型的 64.8%。在测试人工智能浏览零售网站能力的另一部分,GPT-5 得分 81.1%,低于 Claude Opus 4.1 模型的 82.4%。
OpenAI 还表示,GPT-5 比其之前的模型更安全。尽管人工智能推理模型偶尔会表现出针对人类的谋划倾向,或为了达成自身目标而说谎,但 OpenAI 发现 GPT-5 的欺骗率低于其他模型。
OpenAI 安全研究负责人亚历克斯・比图尔表示,降低欺骗性不仅提高了 GPT-5 的安全性,还改善了用户体验,打造出一个 “在用户可信赖的层面上更透明、更诚实” 的模型。
比图尔还指出,GPT-5 能更好地区分试图滥用 ChatGPT 的恶意用户和提出无害请求的用户。这使得 GPT-5 能够拒绝更多不安全的问题,同时减少对寻求无害信息用户的拒绝次数。
为消费者和开发者打造的升级功能
随着 GPT-5 的发布,ChatGPT 迎来了多项用户体验升级。用户现在可以在 ChatGPT 的设置中选择四种新的人格:愤世嫉俗型、机器人型、倾听者型和书呆子型。该公司表示,这些人格将自动调整 ChatGPT 的回应方式,无需用户专门要求模型以特定方式回应。
每月支付 20 美元的 ChatGPT Plus 订阅用户比免费用户拥有更高的 GPT-5 使用限额。而每月支付 200 美元的 Pro 订阅用户可无限制使用 GPT-5,并能访问增强版的 GPT-5 Pro—— 该版本使用额外的计算资源生成更优质的答案。采用 OpenAI Team、Edu 和企业版计划的机构将在下周获得 GPT-5 作为默认模型。
对于开发者,GPT-5 将以三种规格通过 OpenAI 的 API 开放 ——gpt-5、gpt-5-mini 和 gpt-5-nano,它们在任务 “推理” 上花费的时间长短不同。开发者现在还可以通过 OpenAI API 控制回应的详细程度,决定人工智能模型的回应篇幅长短。
GPT-5 基础模型对开发者的收费为:每百万输入令牌 1.25 美元(约合 75 万个单词,比整套《指环王》系列的字数还多),每百万输出令牌 10 美元。
GPT-5 的发布之前,OpenAI 度过了忙碌的一周。该公司发布了开源权重推理模型 gpt-oss,开发者和企业可免费下载,且运行成本极低。这款开源模型的能力几乎与 OpenAI 之前的顶级模型 o3 和 o4-mini 相当,但 GPT-5 在编程等部分领域树立了新的前沿性能标准。
不过,在多个领域,GPT-5 似乎与其他前沿人工智能模型大致相当。当然,基准测试只能反映人工智能模型的部分表现,开发者将如何在现实世界中使用 GPT-5,以及该模型是否真的超越竞争对手,仍有待观察。
- • 《死亡笔记》动画版:一部扣人心弦的悬疑大剧,共13集带你领略死亡笔记的惊悚魅力
- • 降息降准提供充足流动性 二季度地方债有望放量发行
- • 智联招聘信息:开启职业生涯新篇章
- • 佑驾创新盘中涨超4% 股东康成亨国际看好公司前景作出自愿延长限售承诺
- • 财政部副部长廖岷出席二十国集团财长和央行行长系列会议并举行多场双边会见
- • 洛杉矶警方向抗议人群开枪
- • 雨过天晴,诗意盎然——古诗词中的雨后景象
- • 四川航空网上准备系统:智慧航空的助力引擎
- • 揭开南京大屠杀的真相:历史记忆中的黑暗篇章
- • 涉嫌受贿、违法发放贷款,中国建设银行原副行长章更生被逮捕
- • 直通部委|中国快递业务量连续11年位居世界第一 6月全社会用电量同比增长5.4%
- • 七零后油画家潘义奎任中国美术馆馆长,吴为山卸任
- • 碎银子茶:探寻古韵茶香,品味生活之美——碎银子茶的价格解析
- • 人文:探索人类文明的精神家园
- • 诈骗行为猖獗,Meta被指有意放任以维护广告收入
- • 工程机械行业景气度持续回升,三大龙头一季度营收、净利双增
- • 五月天色图:捕捉初夏的斑斓色彩
- • 广西隆林发生一起山洪灾害,致4人遇难
- • 倒票“黄牛”屡禁不绝怎么破?业内:强化文旅市场票务公开制度
- • 锂电产业链周记 | 中国限制锂电池正极材料制备技术出口 藏格锂业子公司因违规开采被责令停产
- • 乌议会称正在起草战时状态结束后选举相关法案
- • 暴雨后上海部分路段变“海上”?记者深夜实探,现场作业人员紧急排水
- • “小学生守则主题班会:培养良好习惯,共建和谐校园”
- • 秦霄贤家世揭秘:从草根出身到娱乐圈新贵
- • 《新金瓶梅:演员阵容大揭秘,经典再现新风貌》
- • 国雄资本宣布投资2亿元布局Web3.0及加密货币资产领域
- • 言短意长|高温下4小时翻遍8吨垃圾找一块儿童手表,值得吗?
- • 气候特征:揭秘地球气候的多样性与复杂性
- • 亚洲最全旅游攻略:探索无尽可能
- • 《电视剧悬崖》:谍战风云中的情感纠葛与信仰坚守
- • 媒体:本地人198,游客298?“阴阳菜单”差的不只是钱
- • 《国际歌中文版:跨越时空的奋斗旋律》
- • 马克思主义理论教育家、清华大学教授林泰逝世,享年94岁
- • 家庭教师污漫:揭开网络低俗内容的神秘面纱
- • 汇丰中国环球私人银行总监缪子俊:高净值群体更愿意尝试另类资产配置
- • 豪车税新规实施,保时捷等4S店现抢购热潮
- • 汪峰与森林北再联手布局商业,成立杭州自留地文化传播公司
- • 攀登者投资方:共筑辉煌,共创未来
- • 雪莲贴:女性私处的健康守护神
- • 盘前:三大股指期货涨跌不一 通用汽车暂停股票回购
- • 《大脚车越野赛无敌版:挑战极限的激情之旅》
- • 坚持同球共济推动智能向善(和音)
- • 双扣打牌:传统与创新的完美融合
- • 英国首相:承认巴勒斯坦国是加沙停火步骤之一
- • 《面壁十年图破壁难酬蹈海亦英雄》——致敬那些坚韧不拔的奋斗者
- • 探索北大名师网:网络时代下的高等教育新平台
- • 针对外国企业和人员的恶性事件频发,中国驻马里使馆发布提醒
- • Excel安装包:轻松掌握办公软件的必备工具
- • 青岛东港场站:港口物流新地标
- • 美联储维持利率不变 预计通胀与失业上升的风险均增加
- • 经济学家华生前妻:一段传奇背后的故事
- • 改变“供强需弱”,收入分配改革是最优解
- • 《孙佳君演绎《人肉叉烧包2》:一部引人深思的黑色喜剧》
- • 从乡村出发,赴一场开心旅行(大数据观察)
- • 新疆多地市民拍到不明飞行物:几秒内加速消失,气象部门回应
- • 揭秘VV116:我国新型新冠疫苗的崛起之路
- • “去势”一词的含义及其在历史与现代社会中的应用
- • 聚焦中华文明精神标识,多校专家学者跨学科对话交流
- • 新债王Gundlach:显然美联储认为利率上的下一步是降低
- • 爆破拆除火车站有关建筑物致周边房屋出现裂缝?重庆渝中通报
- • 廊坊国际会展中心:京津冀地区的重要商务交流平台
- • 赵赫离世:揭开他去世背后的真相
- • 收盘:非农数据与关税令美股受挫 标普指数四连跌
- • 深圳土拍热度再起!厦门国企“黑马”联发溢价47%夺得龙华宅地
- • 魔兽战役地图存放位置详解:探索游戏地图的秘密基地
- • 昨夜今晨国际财经热点一览_2025年5月31日_财经新闻
- • 理想ONE汽车:揭秘这家中国汽车制造商的崛起之路
- • 长安汽车:将在2025年年底完成飞行汽车试飞,2028年实现人形机器人下线应用
- • 美国抵押贷款利率连续第二周上升 30年期升至6.75%
- • 沪深指数大盘走势图:解读中国股市的脉动与趋势
- • 直播网站1234:揭秘热门直播平台背后的故事
- • 店名注册查询:轻松掌握企业命名新技能
- • 财富版图生变:广东缩水、长三角逆袭,AI成为财富跃升主要驱动力
- • 工银价值:引领金融投资新潮流
- • 北大光华院长刘俏2025年毕业致辞:以“未名”之名,做一个自己尊重的人
- • 公司管理制度红头文件:规范企业运作,提升管理效能
- • 嗓子有异物感?试试这些小妙招,轻松缓解不适
- • 人防系统腐败案例:剖析与反思
- • 南京亲子游:畅享家庭欢乐时光
- • 飘天文学:探索宇宙奥秘的璀璨星辰
- • 黑色家电业CFO群体观察:创维数字王茵任职达11年 同洲电子孙贺被深交所通报批评
- • 叙利亚说愿推动恢复叙以《部队脱离接触协议》
- • 《携手共育,共筑孩子美好未来——小学家长会发言稿》
- • 坐飞机时,这些物品你绝对不能带上飞机!
本文 快租网 原创,转载保留链接!网址:https://kuaizu.me/post/25020.html