研究:人工智能在认知障碍测试中表现不佳
《英国医学杂志》最新发表的一项研究显示,在广泛用于检测阿尔茨海默病早期症状的测试中,大部分参与测试的人工智能大语言模型都表现出相当于人类轻度认知障碍的迹象。尽管这只是一项基于观察的研究,但新发现挑战了人工智能将很快取代人类医生的假设。
过去几年,人工智能尤其是大语言模型生成能力取得了巨大进步。在医学领域,这些发展引发了猜测:这些大语言模型能在医疗任务上超越人类医生吗?尽管先前的多项研究表明,大语言模型在一系列医学诊断任务上表现非常出色,但它们的认知能力变化还需要进一步验证。
为填补这一知识空白,以色列哈达萨医疗中心等机构的研究人员使用“蒙特利尔认知评估量表”测试了多个领先和公开的大语言模型的认知能力。这些大语言模型包括由美国开放人工智能研究中心(OpenAI)开发的GPT-4和GPT-4o、由美国Anthropic公司开发的“克劳德3.5”以及由美国谷歌公司开发的“双子座1.0”和“双子座1.5”。
“蒙特利尔认知评估量表”广泛用于检测认知障碍和阿尔茨海默病的早期迹象,通常用于老年人。通过一系列简短的任务和问题,该测试可以评估注意力、记忆力、语言、视觉空间技能和执行功能等能力。得分最高为30分,通常得分26分及以上被视为认知正常。
测试结果显示,GPT-4o得分最高——26分,“双子座1.0”得分最低——16分。所有大语言模型都能很好地完成命名、注意力、语言和抽象等方面的任务,但在视觉空间技能和执行功能测试中都表现不佳。在进一步的视觉空间测试中,大部分大语言模型无法准确解释复杂的视觉场景。
研究人员表示,在需要视觉抽象和执行功能的任务中,大语言模型几乎“全军覆没”,这表明人工智能在临床环境中的使用可能会有困难。因此他们开玩笑说,神经科医生不仅不太可能很快被大语言模型取代,而且他们可能会发现自己将迎来新的“虚拟患者”——表现出轻度认知障碍的人工智能模型。
-
研究:人工智能在认知障碍测试中表现不佳
《英国医学杂志》最新发表的一项研究显示,在广泛用于检测阿尔茨海默病早期症状的测试中,大部分参与测试的人工智能大语言模型都表现出相当于人类轻度认知障碍的迹象。尽管这只是一项基于观察的研究,但新发现挑
2025-05-10 12:23:19 -
人工智能、金融服务……以科技创新为引领 未来产业这样布局→
中央经济工作会议对2025年经济工作进行了具体部署。会议提出明年的重点工作之一是“以科技创新引领新质生产力发展,建设现代化产业体系”。如何加快形成新质生产力?未来产业如何布局? 围绕中央经济工作会议的
2025-05-10 11:31:31 -
人工智能大模型“走进寻常百姓家”
7月2日拍摄的2024全球数字经济大会标识。新华社记者 任超 摄 新华社北京7月4日电(记者郭宇靖、吉宁、张骁)“早上好!”拉开车门,车内响起轻柔问候。“我感到有一点热。”坐进主驾,空调自动送出凉风。越来越多中
2025-05-10 11:03:04 -
走下神坛?AI玩具领域受到消费者追捧 爆款频现
今年上半年,以大模型为代表的AI被认为是悬在空中的概念,离普通老百姓的生活很远。“AI泡沫”也一度成为业界流行的词汇。今年下半年以来,AI从争议中走向应用,随着多个爆款应用的出现,AI与人们的日常生活越来越
2025-05-10 10:41:53 -
大咖畅谈AI发展前景:数据、生态仍是关键,AI Agent极具潜力
12月20日,以“智能・进化”为主题的2024创原会年度技术峰会在海南成功举办。峰会期间,华为云副总裁、战略与产业发展部总裁黄瑾,德勤全球华为客户服务领导合伙人程中,CSDN创始人&总裁蒋涛,值得买科技CTO王
2025-05-10 10:16:58 -
AI加持的荣耀互联网服务 究竟能带来哪些可能?
机会总是与风险并存,正是因为结果的不确定性,不同人对于风险的不同偏好就决定了我们对变革的迥然态度。而现在,我们又走到了下一个转变的十字路口。这一次的转变,由AI引领。2023年GPT的横空出世引领了生成式AI
2025-05-10 09:55:07
-
ChatGPT怎么本地登录_GPT怎么使用_GPT本地项目
本期就ChatGPT的这次更新再次将完全新人使用指南提上日程,并对此次更新做些设想和想象。希望大家喜欢!
2024-12-19 07:41:20 -
AI周报|OpenAI展示新模型o3;智谱完成新一轮30亿元融资
OpenAI展示新模型o3 当地时间周五,OpenAI在为期12个工作日的新品发布活动的最后一天展示了o1模型的下一代o3,并表示该模型有o3版本和精简版o3-mini。OpenAI会在1月底前正式推出o3 mini,并在之后推出完整版的o3
2025-05-05 22:06:11 -
AI绘画ComfyUI进阶教学丨Mask遮罩基础运用,IPA+CN+Lora+prompts+遮罩
本期开始正式进入遮罩相关的高级应用,这里我们会尝试为不同组件应用不同区域的遮罩,实现构图、效果的不同区域实现。希望本期内容能对大家有所帮助和启发,最后如果喜欢欧阳的教程就千万不要忘记支持一波啦!!!
2024-12-17 09:48:56 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
安利超强的AI视频剪辑工具,离线,免费,无需配置
给大家分享一款近期制作的AI分词自动剪辑视频的超强工具,助力大家大幅提升视频剪辑生产力!
2024-12-20 16:49:16 -
Stable Diffusion怎么控制表情_AI绘画局部修改表情怎么做_AI绘画局部控制表情教程
给大家带来了一个超级实用的Stable Diffuison绘画小技巧,就是如何用我们之前提到的After Detailer插件来控制生成人像图片的人物表情!
2024-12-24 17:31:46 -
AIGC基础应用教程丨探索AI在图像放大中的工具使用
当给到的图像素材尺寸太小或者不清晰的时候,有哪些好的AI图像放大的工具可以使用?本期就给大家推荐一些好用的工具
2025-02-06 14:24:28 -
OpenAI推出视觉大模型GPT-4V,为ChatGPT加入眼睛和耳朵丨抖音APP上线方言AI翻译功能丨百度发布首个量子大模型
【AI奇点网2023年9月27日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-02 13:48:08 -
导演郭帆:因为引入AI技术,《流浪地球3》剧组将比上一部减少一半人
郭帆表示,“《流浪地球2》现场最多的时候同时有2200名剧组人员在场,“随着AI技术发展,我预计《流浪地球3》现场拍摄可能会减少到只剩下几百人,就能实现万人级别的工作协同。”
2025-04-21 11:38:20 -
2023智源大会启动:OpenAI CEO奥特曼和Midjourney创始人将亮相
据官方消息,第五届北京智源大会将于6月9日在北京召开。本届智源大会聚集了人工智能领域最关键的人物、最重要的机构。
2025-04-24 13:27:30