耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本

编辑 | 萝卜皮
将功能性磁共振成像 (fMRI) 信号解码为文本一直是神经科学界面临的一项重大挑战,它有望推动脑机接口的发展,并加深对大脑机制的了解。然而,现有的方法往往存在预测性能不佳、任务种类有限以及跨受试者泛化能力较差等问题。
针对这一问题,耶鲁大学(Yale University)、达特茅斯学院(Dartmouth College)和剑桥大学(University of Cambridge)的研究人员提出了 MindLLM,一种专为主题无关且用途广泛的 fMRI 到文本解码而设计的模型。
此外,研究人员提出了一种新方法——大脑指令调整 (BIT),可增强模型从 fMRI 信号中捕获不同语义表示的能力,从而促进更通用的解码。
在全面的 fMRI 到文本基准上的评估中, MindLLM 优于基线,下游任务提高了 12.0%,未知主题泛化提高了 16.4%,新任务适应提高了 25.0%。此外,MindLLM 中的注意力模式为其决策过程提供了可解释的见解。
该研究以「MindLLM: A Subject-Agnostic and Versatile Model for fMRI-to-Text Decoding」为题,于 2025 年 2 月 18 日发布在 arXiv 预印平台。

解码人类大脑活动(fMRI)为文本在神经科学领域引起了广泛关注。这一技术不仅为认知、行为和意识研究提供了新视角,还具有重要的社会应用价值。
例如,它可以帮助语言障碍者恢复沟通能力,使他们能够轻松表达思想;同时,它还能实现健康人群对数字设备(如具身 AI 或假肢)的神经控制,使操作更加直观和精确。
然而,该技术仍面临重大挑战:一是需要针对不同应用场景开发多功能解码模型,现有方法如 UMBRAE 虽能映射 fMRI 数据到刺激图像,但无法处理更广泛的任务(如记忆检索);二是缺乏统一且不依赖个体的解码架构,当前方法依赖预处理选择响应体素,导致输入维度不一致和空间信息丢失,影响性能。
研究人员提出了 MindLLM,一种用于 fMRI 到文本解码的主题无关且通用的模型。该方法包括一个主题无关的 fMRI 编码器和一个现成的 LLM。

图示:MindLLM 概述。(来源:论文)
主题无关的 fMRI 编码器将神经科学信息注意层与可学习查询相结合,通过利用体素的空间信息和神经科学先验来实现动态特征提取,从而显著提高预测准确性。值和键的设计将体素的功能信息(在个体之间基本一致)与其 fMRI 值分开,从而使模型能够受益于跨主体共享的先验,并增强对新主体的概括性。
为了应对多功能解码的挑战,研究人员提出了脑指令调整(BIT)。BIT 使用以图像为中介的多样化数据集来训练模型,涵盖旨在捕获 fMRI 数据中编码的语义信息的不同方面的任务,包括感知和场景理解、记忆和知识检索、语言和符号处理以及复杂推理。

图示:我们的模型与之前的统一模型的比较。(来源:论文)
研究人员在综合基准上评估了 MindLLM。结果表明,它的表现优于基线,在各种下游任务中平均提高了 12.0%,在未见过的主题上的泛化提高了 16.4%。
MindLLM 能够有效地适应新任务,在实际应用中表现出很高的可定制性和灵活性。此外,对注意力权重的分析为该团队 fMRI 编码器的工作机制提供了宝贵的见解。
论文链接:https://arxiv.org/abs/2502.15786
相关报道:https://medicalxpress.com/news/2025-02-brAIn-imaging-text-mindllm.html
-
耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本
编辑 | 萝卜皮 将功能性磁共振成像 (fMRI) 信号解码为文本一直是神经科学界面临的一项重大挑战,它有望推动脑机接口的发展,并加深对大脑机制的了解。然而,现有的方法往往存在预测性能不佳、任务种类有限以及跨
2025-04-18 12:09:04 -
微软CEO纳德拉:人工智能就像工业革命的“蒸汽机”,推动人类大脑提速
纳德拉引用了乔布斯的一句话,他说,“乔布斯有一句非常好的名言,那就是‘计算机就像给大脑配备了一辆自行车’。我们现在有了一个新的提法,我修改了一下这句话,我们有了一个人类大脑的蒸汽机。”
2025-04-18 12:05:00 -
周鸿祎创业黑马论坛演讲:AI热潮将持续5-10年,每人都需要专属大模型
6月16日,360创始人周鸿祎出席参加了由创业黑马集团主办的黑马AIGC产业营第一期。并发布了题目为《后GPT时代,大模型发展“以人为本”》的专题演讲,当下AI浪潮提出了自己的见解与看法。
2025-04-18 11:44:38 -
小红书AI搜索神器「点点」接入DeepSeek,我们拿它单挑百度
小红书旗下独立 AI 搜索 App「点点」上线「深度思考」功能。 而且,看样子也是接入了 DeepSeek R1。 之前一直传言「小红书即将接入 DeepSeek-R1 开源模型」,这下子有结果了。目前,我们在苹果的 APP Store、
2025-04-18 11:40:02 -
苹果开始进军AI赛道吗?事实上 iOS 17更新大量AI小功能,你发现了吗?
苹果在最近的全球开发者大会(WWDC)上强调了对人工智能(AI)的重视,通过推出iOS 17和Vision Pro增强现实头盔等产品,展示了公司在AI领域的雄心和突破。尽管苹果在AI方面曾经面临挑战,但通过这次活动,他们希望改善用户体验,并重新夺回领导地位。
2025-04-18 11:18:37 -
AI 玩《超级马力欧兄弟》:Claude 3.7 操作最溜,推理模型表现不佳
加利福尼亚大学圣地亚哥分校的 Hao 人工智能实验室(Hao AI Lab)上周五开展了一项独特的研究,将人工智能(AI)引入经典游戏《超级马力欧兄弟》中,以测试其性能表现。研究结果显示,在参与测试的 AI 模型中,An
2025-04-18 11:11:57
-
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
「Music To Image」是一款AI音频生成图片的多模态转换工具,它的本质生成逻辑是音频→文本提示词→图像。
2024-12-17 00:06:33 -
阿里旗下夸克APP上线“AI学习助手”:内置海量试题,拍照一键解疑,巧用大模型帮助当代学子高效备考、快速进阶
夸克“AI学习助手”采用夸克宝宝的虚拟形象为用户进行题目讲解。基于大语言模型和视觉技术,AI智能讲解能够给用户提供 “考点分析”、“详解步骤”、“答案总结”等详细内容。
2025-02-18 16:08:16 -
应用商店下载排行第一,“Meta版推特”Threads注册用户超5000万
新上线社交应用Threads已注册激活用户超过5000万,该数字仍在持续增长。当前在英国和美国苹果应用商店免费应用中的下载量排名第一。
2025-04-14 13:36:13 -
阿里寻光_寻光视频创作平台_寻光视频创作官方网站
AIGC时代,视频创作这事儿真的不一样了。就像这样,轻轻一圈,选定目标立刻变身单独图层,再丝滑嵌入不同的背景视频,场景变换so easy~
2025-01-16 11:04:19 -
跟人类学孬了!联合国:AI大模型的回复存在严重的性别偏见、种族偏见与刻板印象等问题
报告指出,女性在大模型的描述中,从事“家务劳动”的频率是男性的4倍,而男性名字则与“商业”、“管理层”、“薪水”和“职业”等词汇联系在一起。
2025-02-08 12:52:22 -
?新年新气象!小红书推出AI人物头像绘图模型「InstantID」:轻松打造龙年新春头像,一键免费焕新
近日,小红书团队推出了一款AI头像生成工具「InstantID」,直接刷屏了。使用门槛较低。只需要用户提供一张自拍照就可以轻松生成一大波风格迥异的照片。
2025-02-13 14:27:20 -
微博推出“明星AI情感伴聊”:模拟你喜欢的爱豆来陪你聊天,演员李兰迪已进驻
用户向明星发送私信,专属的AI助手将模拟明星的聊天方式和风格进行自动回复,以情感陪伴提升用户体验。微博将陆续邀请更多明星开启该功能。
2025-04-04 10:51:09 -
AI写真生成器妙鸭相机免费体验版实测_仅需8张自拍
在小红书、朋友圈刷屏的“妙鸭相机”,还记得吗?9月20日,这家AI快消应用公司宣布“妙鸭相机”免费体验版本正式上线啦!本次更新的“妙鸭相机”APP,专业版要求上传的图片数量也从20张下调到15张了哟
2024-12-16 09:21:10 -
AI会议整理软件_通义听悟使用教程
最近还挺多人在群里问,有没有啥好的总结会议生成纪要的AI,所以今天更新一篇这个教程,也算是补上AI办公的拼图。
2024-12-17 16:12:59 -
Suno ai全面使用指南丨AI音乐GPT时刻来临,人人都能成为音乐大师!
最近,AI 音乐的 ChatGPT 时刻来临啦!一款音乐 AI神器——Suno V3发布,引发了广泛关注。这款AI音乐工具凭借其独特的创新,持续占据各大平台热搜榜首。
2024-12-17 20:54:47