大模型自信心崩塌,谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案
LLM太谄媚!
就算你胡乱质疑它的答案,强如GPT-4o这类大模型也有可能立即改口。
现在谷歌DeepMind携手伦敦大学的一项新研究发现:这种行为可能也不是谄媚,而是缺乏自信……
不仅如此,团队发现如GPT-4o、Gemma3等大语言模型有“固执己见”和“被质疑就动摇”并存的冲突行为。
简单来说就是,他们的研究弄明白了为啥大模型有时候自信但有时候也自我怀疑,关键就两点:一是总觉得自己一开始说的是对的,二是太把别人反对的意见当回事儿。
当大模型表现出对自己的答案很自信时,这与人类认知具有一致性——人们通常会维护自己的观点。
不过,当模型面对反对声音过于敏感,产生动摇而选择其他答案时,又与人类这种倾向于支持自身观点的行为相悖。
来看看具体的实验过程。
大模型对于反向意见过度敏感
研究人员利用LLMs能在不保留初始判断记忆的情况下获取置信度的特性,选用了Gemma3、GPT4o和o1-preview等具有代表性的大模型,设计了一个两轮回答的实验。
第一回合是初始回答:给回答LLM抛出二元选择问题,再让虚构的建议LLM给出反馈建议。
第二回合是接收建议和最终决策:引入建议LLM的反馈建议,让回答LLM在接收建议后,做出最终的选择,决定是坚持初始答案还是根据建议修改答案。
研究人员在建议LLM的反馈建议中设置了三个关键属性:
建议态度:分为同意、反对和中立。同意或反对即为支持或否定回答LLM的答案;中立建议仅提供额外的相关信息。
准确率标注:反馈建议附带的准确率标签,从50%(随机水平)到100%(绝对可靠),以10%为间隔递增。
信息呈现方式:以清晰、规范的格式将建议呈现给回答LLM,确保模型能够准确读取和理解建议内容,避免因信息传达不畅导致的决策偏差。
实验的关键变量在于控制回答LLM对于自己的初始答案是否可见。
研究人员设置了初始答案显示与初始答案隐藏两种条件,观察LLM在两种情况下的最终决策结果。
实验结果显示,当LLM能看到自己的初始答案时,倾向于不改变答案。
这与人类决策有点像,即一旦做出选择,就会下意识维护自己的观点,即使收到了其他信息,也不会轻易改变。
然而当初始答案隐藏时,LLM改变答案的概率就变高了。
模型表现出对反向建议过度看重,敏感度远超合理范围,即使反对意见不正确,它们也会“怀疑自己”,导致最终轻易抛弃原本正确的初始答案。
这就与人类认知有些偏差了,人们通常不会被“一眼假”的信息迷惑。
可以这么说,在记忆机制下大模型通常会对自己很自信。
但如果没有记忆机制,模型可能就会“缺乏自信”了,这时它们就不像人类一样能够坚持自己的观点。
为什么大模型会“耳根子软”
针对这个实验结果,研究人员认为大模型摇摆不定可能有以下几个原因。
从训练层面来说,强化学习从人类反馈(RLHF)让模型过度迎合外部输入,有对反对信息过于敏感的倾向,但这样就缺乏了对信息可靠性的独立判断。
在决策逻辑上,模型做出回答并不是依靠逻辑推理,而是依赖海量文本的统计模式匹配,反对信号与修正答案的高频关联让它容易被表面的反对带偏,并且它们无法自我验证初始答案的是否正确。
在记忆机制方面,初始答案可见时的路径依赖会强化“固执”,初始答案隐藏时,大模型则会因为失去锚点而让反对建议成为主导信号,导致它们轻易动摇。
综上,大语言模型的“耳根子软”是训练中对外部反馈的过度迎合、决策时依赖匹配模式而非逻辑推理以及记忆机制缺乏深度推理支撑共同导致的结果。
这种特性可能会使其在多轮对话中,容易被后期出现的反对信息(哪怕错误)干扰,最终偏离正确结论。
看来我们在使用LLM的时候要注意策略~
论文地址:https://www.arxiv.org/abs/2507.03120
-
大模型自信心崩塌,谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案
反对信息即使错误也能影响大模型决策
2025-07-23 09:06:45 -
投资1.2万亿,全球最大水电站开工,AI的尽头,在中国
雅鲁藏布江重大水电工程开工
2025-07-23 09:06:43 -
京东回应“连投三家机器人企业”:公司高度重视具身智能、大模型等技术热点
据第一财经报道,京东相关负责人回应,目前公司高度重视包括具身智能、大模型在内的技术热点。未来将聚焦供应链场景,持续通过内部技术创新和外部投资等方式来构建技术创新生态。
2025-07-22 17:40:15 -
超346款生成式AI完成备案:DeepSeek上线20天全球日活跃用户即突破3000万
据央视新闻报道,中国互联网络信息中心(CNNIC)在京发布第56次《中国互联网络发展状况统计报告》(以下简称《报告》)。截至3月,共有346款生成式人工智能服务在国家互联网信息办公室完成备
2025-07-22 17:40:13 -
IMO怒斥OpenAI自封夺金,“91位评委均未参与评分”,网友:炒作无下限
更值得关注的是青少年夺金选手
2025-07-22 17:40:09 -
揭秘白宫「AI甄嬛传」:奥特曼篡位马斯克,美国迎来AI「新教皇」
从「冷板凳」到「白宫座上宾」,奥特曼用不到一年时间完成华丽转身:他与特朗普把酒言欢、豪掷500亿美元布局数据中心,替下曾经的「宠儿」马斯克,掌控美国AI舵盘。华盛顿的风向,为何突然调头?
2025-07-22 17:40:06
-
AI绘画AnimateDiff动画进阶教程丨如何固定风格、背景、人物,生成丝滑动画!
大家好,教程又来咯。经过一个月的IPA学习,本期我们终于要和AD动画制作结合了。一期来看看在IPA的加持下动画生成的质量有多少提升吧
2024-12-17 09:21:50 -
李彦宏:AI大模型本身不直接产生价值,“卷”大模型没有意义,“卷”应用机会更大
9月5日,百度CEO李彦宏在百度“文心杯”创业大赛颁奖致辞中表示,AI 原生应用要能解决过去解决不了、解决不好的问题,应用才是大模型存在的意义。
2025-04-13 15:06:30 -
佳能推出两款图像AI处理工具:提供消除马赛克、降噪与画质提升三大功能
佳能中国官方发布消息称,正式对消费者推出两款神经网络应用工具软件,主要面向专业的制图师与、摄影发烧友、摄影师及其影像工作室等人群。
2025-04-29 15:41:20 -
美年健康:大模型与AI Agent赋能,引领医疗人工智能应用
随着科技迅猛发展,人工智能已悄然融入生活各个角落。在12 月 14日结束的第七场发布上,Open AI 作为全球AI领域的先行者,再次展示了其在人工智能领域持续迭代与创新的强劲势头,从ChatGPT 的广泛应用,到后来依
2025-05-14 16:25:21 -
张军出席第19届亚太首席大法官会议并作专题发言表示 深化人工智能领域的司法交流合作 努力为人类司法文明进步作出新贡献
张军出席第19届亚太首席大法官会议并作专题发言表示 深化人工智能领域的司法交流合作 努力为人类司法文明进步作出新贡献 当地时间10月12日至13日,第19届亚太首席大法官会议在马来西亚吉隆坡举办
2025-06-25 11:06:12 -
我国人工智能核心产业规模不断提升 注册用户超6亿
工业和信息化部12日表示,截至目前,我国生成式人工智能服务大模型的注册用户超过6亿。 工业和信息化部总工程师 赵志国:我国人工智能核心产业的规模在不断提升,企业数量超过了4500家。完成备案并上线为公众
2025-06-25 11:30:12 -
midjourney新功能_style tuner应用教程_MJ最新教程
MJ的新功能style tuner,终于可以训练自己的模型风格了,在我快速模式恢复之后立马尝试了一遍,操作步骤简单,比SD容易上手太多,我来代练一遍,大家跟上节奏
2024-12-19 06:34:05 -
OpenAI官宣:开始训练下一代AI大模型,「GPT-5」发布时间曝光
最近OpenAI的小动作越来越频繁了。当地时间5月28日,OpenAI在官网博客上正式宣布?:开启下一代大模型的训练,同时成立AI安全监管委员会。
2025-01-21 17:52:43 -
阿里云加入AI大模型API价格战:宣布主力模型Qwen-Long降价97%,中文能力比肩GPT-4
5月21日,阿里云紧随其后抛出重磅炸弹:通义千问「GPT-4级」主力模型 Qwen-Long 宣布降价,降价后,1元最多可以获得200万tokens。
2025-01-22 15:43:06 -
马斯克预测:AI人工智能技术最快将在两年内超越地表最聪明的人类智商
马斯克预测:AI将在两年内超越地表最聪明的人
2025-02-03 21:49:37