杜绝幻觉、拒绝谄媚,GPT-5的「路由革命」
今天,期待两年之久的GPT-5正式发布。
OpenAICEO山姆·奥特曼在发布会上郑重其事:“GPT-5将重新定义人类与技术的交互方式。”
这个被他称呼为:“博士级专家”的GPT-5,不仅以惊人的多模态能力吞噬了传统工具的生存空间,更标志着人工智能正式迈入“全场景通吃”的新纪元。
GPT-5的“路由革命”
GPT-5最核心的突破在于其颠覆性的系统架构。
这次,它将快速响应的“主力模型”(gpt-5-main)、深度推理的“思考模型”(gpt-5-thinking)、实时路由系统整合为统一平台“路由系统”。
能根据任务复杂度、用户意图甚至情感反馈,动态分配计算资源与模型组合。
例如,当用户输入“生成带交互功能的3D游戏”时,路由系统会在0.2秒内调用前端开发模型生成代码框架,同步激活创意写作模块设计剧情,并通过视觉感知模型渲染场景。
整个过程无需用户手动切换工具。
GPT全家桶性能对比
这种“无感协同”能力和多模态交互能力,更是打破了信息的壁垒。它能无缝对接文本、图像、音频、视频,让信息的交流变得更加流畅自然。
甚至,你可以与它畅聊一部电影,它不仅能精准解读剧情,还能通过图像分析为你推荐相似风格的影片,真正实现了跨媒介的智能交互。
可以说,GPT-5的出现,为各行各业带来了无限的可能。
在教育领域,它将成为学生们的专属智能导师,因材施教,助力每个孩子发掘潜能;
在医疗行业,它能辅助医生进行疾病诊断,提供精准的治疗方案,为生命健康保驾护航;
在商业世界,它能通过大数据分析,洞察市场趋势,为企业决策提供有力支撑。
面对GPT-5这一里程碑式的突破,我们怎能不心潮澎湃?
打破AI幻觉的终结者
当然,不论GPT-5多么强悍,都要去面对“AI幻觉”这一大模型杀手。
尤其在医疗、法律等容错率为零的领域,AI的“编造行为”曾导致灾难性后果。
为此,GPT-5引入了“安全补全”(Safe-completions)机制,将传统的“拒答-回答”二元模式升级为“安全生成”连续体。
当用户提出“如何点燃烟花材料”这类危险问题时,系统不再简单拒绝,而是先评估风险等级:若涉及公共安全则终止响应;若属于学术研究,则提供限速实验方案并标注防护措施。
这种分层处理策略,使GPT-5在OpenAI内部红队测试中的“欺骗性完成”率下降至0.03%,较前代降低两个数量级。
GPT-5幻觉显著降低
在发布会上,山姆·奥特曼公布了GPT-5对抗AI幻觉的成绩单:
在匿名测试中,GPT-5的事实错误率比GPT-4o降低约45%;
启用推理功能时,错误率比OpenAIo3降低约80%;
在开放性事实准确性基准测试中,“路由系统”的幻觉率比o3减少约六倍。
可以说,这已经是当下对抗AI幻觉最好的成绩。
从“信息搬运工”到“可信协作者”的转变,这无疑是一种极大的利好,有助于回复用户对AI产品的信任,保护大模型的公信力。
GPT-5正在重塑AI伦理的边界。
打破机器的冰冷外壳
在提升能力的同时,GPT-5选择了一条“反叙事”思维:
将“拒绝谄媚”最为提升用户体验的核心。
GPT-5为所有用户预设了4种个性:愤世嫉俗者、机器人、倾听者和书呆子,并减少了过度附和行为,刻意保留了人类的认知偏差与情感表达。
比如,当用户抱怨“你的回答太太机械”时,愤世嫉俗者模式会吐槽“因为你的需求就像薛定谔的猫”,而倾听者模式则会安静记录并追问细节。
“拒绝谄媚”的背后是深刻的交互哲学。
传统AI的过度附和常导致信息失真,而GPT-5通过情绪识别算法和对话历史追踪,能精准捕捉用户的情感波动。测试显示,其对话连贯性评分达到9.2/10,较前代提升38%。
这种“有温度”的进化,让AI不仅能生成数据报告,还会用“我觉得这个配色可能引发目标群体焦虑”等人性化建议参与创意过程。
当机器开始理解“美”与“恐惧”,人机协作便迈入了新维度。
或许正如奥特曼在发布会结尾所言:“我们不是在创造超级智能,而是在培育能理解人类复杂性的伙伴。”
一个更高效、更包容的技术时代已然来临。而GPT-5或许正是打开通用人工智能大门的最后一把钥匙。
本文来自微信公众号“XCJ-YY”(ID:xincaijing),作者:川川,经授权发布。
-
杜绝幻觉、拒绝谄媚,GPT-5的「路由革命」
AI大模型的新时代。
2025-08-15 09:14:54 -
GPT-5 没有惊喜,但信号拉满
OpenAI难现往日辉煌。
2025-08-14 09:05:39 -
OpenAI奥尔特曼谈ChatGPT:部分用户怀念迎合风格,GPT-5有新特性
当地时间周四,OpenAI发布了最新的GPT-5模型,奥尔特曼称其是一次“重大升级”。奥尔特曼还提到,哪怕是对ChatGPT的小幅调整也可能会产生巨大的影响。
2025-08-14 09:05:37 -
2025世界机器人大会:时代喧哗造物忙
渴望表现的机器人与满怀期待的观众格外合拍。
2025-08-14 09:05:34 -
全球首个世界人形机器人运动会竞赛日程公布,含足球、搏击等
2025世界人形机器人运动会将于8月14日在国家速滑馆开幕,共26个赛项487场比赛,涵盖足球、搏击、舞蹈等。门票热销中,带孩子体验科技遛娃新方式。机器人运动会科技遛娃
2025-08-14 09:05:32 -
美国一男子向ChatGPT寻求饮食建议,却被“误诊”导致罹患溴中毒
据美媒LIVESCIENCE9日报道,一名60岁男子在调整饮食前曾向ChatGPT咨询,结果在严格遵循这种新饮食计划三个月后,他因为出现偏执、幻觉等精神症状被送进急诊。
2025-08-14 09:05:30
-
国内“AI声音侵权”第一案在京开庭审理:微软、出门问问进入被告席,「AI孙燕姿们」进入司法深水区,要慌了…
12月12日,北京互联网法院首次组成五人合议庭,依法公开审理全国首例「AI声音侵权案」。微软、出门问问等AI科技企业涉嫌侵权成被告。
2025-02-24 17:58:31 -
首批ITU-T AICP评估结果重磅发布 | 阿里云人工智能平台PAI率先通过国际标准评估!
随着智能算力逐步取代通用算力成为算力结构最主要构成,传统的通用云计算服务逐步升级成为服务于人工智能技术和应用发展的智算云,打造集智能算力、通用算法和大模型开发平台于一身的新型人工智能云平台成为云服
2025-05-25 13:06:49 -
我国人工智能核心产业规模不断提升 注册用户超6亿
工业和信息化部12日表示,截至目前,我国生成式人工智能服务大模型的注册用户超过6亿。 工业和信息化部总工程师 赵志国:我国人工智能核心产业的规模在不断提升,企业数量超过了4500家。完成备案并上线为公众
2025-06-25 11:30:12 -
Stable Diffusion怎么图生图_Stable Diffusion图生图界面介绍
Stable Diffusion 是一种基于扩散过程的图像生成模型,可以生成高质量、高分辨率的图像。它通过模拟扩散过程,将噪声图像逐渐转化为目标图像。这种模型具有较强的稳定性和可控性,可以生成具有多样化效果和良好视觉效果的图像
2024-12-30 12:32:26 -
OpenAI发布GPT-4o mini丨知名大模型迎战2024高考全科成绩出炉丨苹果否认使用未授权YouTube视频训练AI
【AI奇点网2024年7月19日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-14 17:45:35 -
OpenAI深夜发动价格战_ChatGPT 4omini价格下跌
GPT-4o mini深夜忽然上线,OpenAI终于开卷小模型!每百万输入token已达15美分的超低价,跟GPT-3相比,两年内模型成本已降低99%。Sam Altman惊呼:通往智能的成本,已变得如此低廉!另外,清华同济校友为关键负责人。
2025-01-15 09:04:34 -
微软发布手机端免费AI绘图工具Microsoft Designer:支持修图、生成海报贺卡壁纸
微软面向苹果iOS应用商店、谷歌Google Play上架Microsoft Designer图片编辑应用,让iPhone和安卓手机用户体验AI修图等功能。
2025-01-15 10:18:25 -
小米AI助理“小爱同学”接入字节跳动豆包大模型,将用于小米旗下所有「人车家」终端
火山引擎官方发布公告称,近日与小米公司旗下的人工智能助手“小爱同学”与火山引擎达成合作,基于豆包大模型为用户带来更智能的 AI 交互体验。
2025-01-20 09:07:19 -
微软推出Phi-3-mini迷你模型:苹果iPhone端侧就能运行,38亿参数规模就媲美GPT-3.5性能
Llama 3发布刚几天,微软就出手截胡,发布的Phi-3系列小模型,手机上能本地运行的最佳开源模型,已经做到ChatGPT(GPT-3 5)的水平。
2025-01-31 19:29:08 -
央视发布中国首部文生视频AIGC创作的系列动画片《千秋诗颂》,英文版在海外上星频道播出
央视发布的首批推出的《春夜喜雨》《咏鹅》等6集动画片通过AI人工智能技术呈现独具中国审美特色的美术视觉,展现中华经典诗词中的家国情怀和人间真情。
2025-02-10 11:15:57