GPT-5 没有惊喜,但信号拉满
在GPT-4发布两年之后,经历多次“跳票”的GPT-5终于在今日登场。
北京时间8月8日凌晨1点,OpenAI举办了一场超过一小时的发布会,系统展示了GPT-5在智能水平、编程能力、任务推理等维度的性能迭代。
但相比此前GPT-3到GPT-4所带来的全方位升级,许多人表示,这次GPT-5并没有带来更多的惊喜,从发布会规模、产品亮点、到性能升级,都显得较为平庸,相较当前主流SOTA模型,提升幅度并不显著。
反倒是价格策略成了此次发布的最大亮点。GPT-5的API调用价格仅为前几日发布的ClaudeOpus4.1的1/15,显著低于Gemini2.5Pro,在当前大模型市场上展现出极强的性价比。
近两年,随着AI工具开始席卷各行各业,人们渴望AI能够取代重复繁琐的工作,也在担忧自己是否会被AI所取代,这也是GPT-5发布前备受关注的原因之一。但就目前GPT-5的能力突破来看,人类智能在通往AGI的路上仍有很长一段路要走。
回顾过去几年GPT的迭代历程,不仅是众多AI公司争相效仿的对象,也是整个大模型行业发展的缩影。而此次GPT-5相对平庸的表现,虽然打破了外界对大模型技术持续突破的惯性认知,但某种程度上,也在大多数人的意料之中。
相比AI兴起阶段大众对于大模型技术的过高展望,市场上有关大模型参数突破的讨论正势渐微弱。相比起技术突破,人们开始更加关心的是,AI如何更有效地渗透进日常生活。
从GPT1到GPT5,GPT的未来要走向哪里?
自2018年OpenAI发布首个大模型GPT-1以来,GPT系列已经走过了七年。
2020年GPT3的出现,让大模型参数规模从15亿直接拓展到了1750亿,也因此通过“上下文学习”能力,摆脱了对大量标注数据的依赖,使大模型能够开始作为效率工具使用。
两年后,基于GPT-3.5构建的对话式模型ChatGPT上线,进一步推动大模型走入C端日常,成为通用AI应用的重要落地转折点。
随后GPT-4的全面升级,更是在实现万亿级模型参数的同时,让大模型在单纯文本输出的基础上,实现了图像的交互提升。
此后一年里,GPT发布的多款模型,都在围绕图像、语音互动等多模态能力迭代;deepseek的横空出世,将推理模型带向了大众视野,去年OpenAI接连发布了O1、O3系列产品,将复杂推理作为了性能优势,开始强调对科学、编程等专业领域的协助能力。
与此同时,围绕大模型参数量的宏大叙事开始逐渐消失,转变为对多模态、长文本等细节能力的追求,以及对医疗、教育等落地场景的讨论。正因如此,大模型产品形态也开始从单一模型转向了多版本并行。
截至目前,OpenAI已构建起由GPT系列(主打对话交互)、O系列(聚焦复杂推理)以及图像/视频生成模型(支撑多模态创作)组成的三大产品矩阵。
在本次升级的GPT-5中,GPT进一步统一了O系列的推理能力和GPT的快速响应,相比较deepseek在模型使用时,自主选择是否使用深度思考模式,GPT-5的区别在于能够自动判断对话类型。
除此之外,在此次发布会中,OpenAI首次同时推出了4个版本,标准版GPT-5、轻量级的GPT-5mini与GPT-5nano,以及面向企业与高级订阅用户的GPT-5Pro(需企业授权或月付200美元)。加深了按需定制、分层定价的SaaS化路径演进。
这种转变也意味着,对于AI公司来说,竞争的门槛不再仅是技术突破,还在于是否具备构建产品体验、搭建商业模型、整合跨界资源的综合能力。
GPT-5难产真相:大模型升级为何越来越难?
DeepSeek上线所带来的用户量激增,不仅向外界证明了开源模型的商业化可行性,也进一步加深了大模型公司对“先发优势”的重视。当模型性能差距趋于收敛,前期对于用户心智的争夺上升为第一要义。
正因如此,随着GPT-5问世的风声不断,最近一段时间,各大厂商开始纷纷加速竞跑,相继推出新品。
字节在两个月前将豆包更新至1.6版本,阿里也在昨日推出了Qwen3-4B-Instruct-2507与Thinking-2507双版本,MiniMax近几日发布了新一代语言生成模型Speech2.5,智谱也在上月底发布旗舰模型GLM-4.5……一场集中式更新潮,给沉静许久的大模型赛道掀起了又一波浪潮。
但当我们把时间拉长来看,这波密集的模型上新趋势,距离上一次“百模大战”的盛景,已经过去了一年多。
大模型的更新趋势正在逐渐放缓。不仅如此,相较GPT-3到GPT-4参数暴涨、多模态突破、上下文显著增强的跃迁,近期多款新品的提升幅度也显得颇为有限,大多数模型的升级和GPT-5一样乏善可陈。
很多人把背后的原因归结为数据瓶颈。
去年万众瞩目的Orion,项目开发时长超过了18个月,曾经被寄予厚望,原计划作为GPT-5推出。结果在验证时,性能却远未达到预期,最终只能被降级成GPT-4.5,在今年2月默默上线。
据业内人士称,Orion之所以失败,最核心的原因在于,团队摸到了预训练阶段的天花板。随着训练数据的不断扩充,高质量网络数据存量不断减少,直接导致了模型训练效果的下降。
除此之外,随着大模型参数量不断增加,硬件水平所带来的掣肘也在越发放大,据媒体报道,有开发人员透露,OpenAI在去年年底所推出的推理模型O3,之所以能够实现核心的性能提升,主要依赖于使用更多的英伟达芯片进行开发。
更进一步的问题在于,大众对于AI幻觉、AI味的抵制正在呈现更为激进的态势。
GPT-5发布前夕,奥特曼曾在社交平台分享了模型对话能力的演示。但出乎意料的是,评论区关注的焦点已不再是性能指标,而是GPT频繁使用破折号的语言习惯。
此前OpenAI在今年2月推出的GPT4.5,核心性能升级也在于提升模型情商,减少AI痕迹。与此同时,在有关GPT-5的权威测评数据中,也表示出AI事实性幻觉的大幅减少。
但正如众多网友所吐槽的那样,相比较数学能力的准确度提升,GPT-5在写作流畅度、情商表现上却远不如GPT4.5。
某种程度上来说,AI的思维机制和生成原理,注定了“事实性幻觉”始终是一种概率性存在。
Meta首席AI科学家杨立昆曾经对当前主流的LLM背后的自回归模型表示质疑,认为其通过预测下一个词来生成文本的模式,本质上无法孕育出真正的智能。
这一判断也对过去大模型训练逃不开的ScalingLaw路线进行了质疑,即单纯增加参数数量并不能使得AI更好的拟合人类智能。背后的原因在于,两者在思维结构上存在本质不同,前者是从更大、更多的参数中,以最小的成本组织信息;而后者则为了在不确定中生存和繁衍,具有更强的冗余性和模糊性。
AIAgent落地,大模型要让位?
一直以来,围绕ChatGPT的订阅收费、API接口调用是OpenAI的重要盈利来源,但随着今年AIAgent的大量涌现,大模型公司的商业化重心,开始发生了迁移。
上半年,OpenAI发布了两款基于ChatGPT的AIAgent,一是可以代替用户操作浏览器,自主执行任务的Operator;二是可以辅助做深入研究,生成专业研究报告的DeepResearch。
据TheInformation披露相关文件表示,OpenAI已告知投资者,预计到2025年末,AIAgent及其他新产品的合计销售额将超越ChatGPT。
与此同时,对比去年全年37亿美元的营收,OpenAI预计今年的营收能达到127亿美元,相比去年的营收估值足足增长了2倍以上。背后最重要的驱动力之一,就是AIAgent。
事实上,AIAgent的商业化爆发并非OpenAI独享。以辅助编程为核心的“vibecoding”编辑器Cursor便是典型代表。
凭借多行智能重构、代码自动补全和代码库查询等功能,Cursor付费用户已超36万,最新估值较年初激增三倍。与此同时,曾引发全网“账号抢购”热潮的Manus,尽管被曝“出逃海外”,依然反映出AIAgent在垂直细分领域的极高用户粘性。
AIAgent的兴起,一方面得益于大模型底层性能的持续提升,另一方面则源自各垂直领域对定制化智能工具的刚性需求。这种需求不仅使得Agent能够更精准、高效地服务专业场景,也催生了更强的用户依赖。
但需要指出的是,AIAgent在实际应用中通常面临更高的Tokens消耗,这对创业公司尤其是资金实力有限者而言是沉重的压力。Manus的“出逃”,一定程度上折射出了初创团队在高成本运维与现金流压力下的两难境地。
此外,AIAgent本质上是建立在大模型基座之上的“套壳”应用,模型能力的天花板直接限制了Agent的性能上限。相较之下,OpenAI等头部大模型厂商在底层模型研发上拥有明显优势,也因此更具主导权和话语权,这也解释了为何它们不会放弃AIAgent的开发与布局。
由此可见,大模型商业化正加速向细分场景和专门化应用迁移。另一个与之相佐证的趋势在于,OpenAI对“大模型闭源”的保守态度开始出现了松动。
在GPT-5发布前夕,OpenAI时隔三年再次推出了两款开源模型:gpt-oss-120b和gpt-oss-20b。这一动作不仅被外界视作GPT-5发布前的技术热身,也被认为是在试图回应业界对模型开源日益高涨的呼声。
与此同时,GPT-5调用价格也被进一步拉低,仅为前几日发布的ClaudeOpus4.1的1/15。当模型迭代的平台期和Agent商业化趋势同时出现,从“卖模型”转向“卖能力”,大模型公司的产品重心正在发生实质性转变。
-
GPT-5 没有惊喜,但信号拉满
OpenAI难现往日辉煌。
2025-08-14 09:05:39 -
OpenAI奥尔特曼谈ChatGPT:部分用户怀念迎合风格,GPT-5有新特性
当地时间周四,OpenAI发布了最新的GPT-5模型,奥尔特曼称其是一次“重大升级”。奥尔特曼还提到,哪怕是对ChatGPT的小幅调整也可能会产生巨大的影响。
2025-08-14 09:05:37 -
2025世界机器人大会:时代喧哗造物忙
渴望表现的机器人与满怀期待的观众格外合拍。
2025-08-14 09:05:34 -
全球首个世界人形机器人运动会竞赛日程公布,含足球、搏击等
2025世界人形机器人运动会将于8月14日在国家速滑馆开幕,共26个赛项487场比赛,涵盖足球、搏击、舞蹈等。门票热销中,带孩子体验科技遛娃新方式。机器人运动会科技遛娃
2025-08-14 09:05:32 -
美国一男子向ChatGPT寻求饮食建议,却被“误诊”导致罹患溴中毒
据美媒LIVESCIENCE9日报道,一名60岁男子在调整饮食前曾向ChatGPT咨询,结果在严格遵循这种新饮食计划三个月后,他因为出现偏执、幻觉等精神症状被送进急诊。
2025-08-14 09:05:30 -
穿透GPT5,我们可以看到什么?
AI五层级划分,无人公司演进路径与挑战分析。
2025-08-13 09:10:47
-
国内“AI声音侵权”第一案在京开庭审理:微软、出门问问进入被告席,「AI孙燕姿们」进入司法深水区,要慌了…
12月12日,北京互联网法院首次组成五人合议庭,依法公开审理全国首例「AI声音侵权案」。微软、出门问问等AI科技企业涉嫌侵权成被告。
2025-02-24 17:58:31 -
首批ITU-T AICP评估结果重磅发布 | 阿里云人工智能平台PAI率先通过国际标准评估!
随着智能算力逐步取代通用算力成为算力结构最主要构成,传统的通用云计算服务逐步升级成为服务于人工智能技术和应用发展的智算云,打造集智能算力、通用算法和大模型开发平台于一身的新型人工智能云平台成为云服
2025-05-25 13:06:49 -
我国人工智能核心产业规模不断提升 注册用户超6亿
工业和信息化部12日表示,截至目前,我国生成式人工智能服务大模型的注册用户超过6亿。 工业和信息化部总工程师 赵志国:我国人工智能核心产业的规模在不断提升,企业数量超过了4500家。完成备案并上线为公众
2025-06-25 11:30:12 -
OpenAI发布GPT-4o mini丨知名大模型迎战2024高考全科成绩出炉丨苹果否认使用未授权YouTube视频训练AI
【AI奇点网2024年7月19日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-14 17:45:35 -
OpenAI深夜发动价格战_ChatGPT 4omini价格下跌
GPT-4o mini深夜忽然上线,OpenAI终于开卷小模型!每百万输入token已达15美分的超低价,跟GPT-3相比,两年内模型成本已降低99%。Sam Altman惊呼:通往智能的成本,已变得如此低廉!另外,清华同济校友为关键负责人。
2025-01-15 09:04:34 -
微软发布手机端免费AI绘图工具Microsoft Designer:支持修图、生成海报贺卡壁纸
微软面向苹果iOS应用商店、谷歌Google Play上架Microsoft Designer图片编辑应用,让iPhone和安卓手机用户体验AI修图等功能。
2025-01-15 10:18:25 -
小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
火山引擎官方发布公告称,近日与小米公司旗下的人工智能助手“小爱同学”与火山引擎达成合作,基于豆包大模型为用户带来更智能的 AI 交互体验。
2025-01-20 09:07:19 -
微软推出Phi-3-mini迷你模型:苹果iPhone端侧就能运行,38亿参数规模就媲美GPT-3.5性能
Llama 3发布刚几天,微软就出手截胡,发布的Phi-3系列小模型,手机上能本地运行的最佳开源模型,已经做到ChatGPT(GPT-3 5)的水平。
2025-01-31 19:29:08 -
央视发布中国首部文生视频AIGC创作的系列动画片《千秋诗颂》,英文版在海外上星频道播出
央视发布的首批推出的《春夜喜雨》《咏鹅》等6集动画片通过AI人工智能技术呈现独具中国审美特色的美术视觉,展现中华经典诗词中的家国情怀和人间真情。
2025-02-10 11:15:57 -
OpenAI高管发内部信:马斯克起诉奥特曼和OpenAI的行为,纯属个人恩怨,他就是不甘心
OpenAI 首席战略官 Jason Kwon 在周五向其在职员工发送了一份备忘录,对马斯克的诉讼在公司内向员工们作出回应。他认为马斯克的诉讼源于个人层面的问题
2025-02-10 12:01:42