让AI“开口说话”:复杂模型的解释不再晦涩

解读模型背后的逻辑
研究人员重点研究了一种流行的机器学习解释方法——SHAP。在 SHAP 解释中,模型会为每个特征分配一个数值,以表明该特征对预测结果的影响。例如,当一个模型用于预测房价时,房屋位置可能是其中一个特征,而位置这一特征将被赋予一个正值或负值,表示它对模型整体预测的增减作用。
SHAP 解释通常以柱状图形式展示哪些特征最重要或最不重要,然而,当模型包含超过 100 个特征时,这种柱状图可能变得难以解读。
“作为研究人员,我们必须对展示内容做出许多选择。如果我们只显示前 10 个特征,用户可能会质疑其他特征为什么没出现在图中。而使用自然语言可以免除我们做出这些选择的负担。”资深作者 Kalyan Veeramachaneni 解释道。
但不同于直接使用 LLM 生成自然语言解释,研究人员采用 LLM 将已有的 SHAP 解释转化为可读的叙述,以减少生成过程中可能引入的误差。
研究人员开发的系统名为 EXPLINGO,包含两个协作部分。第一部分名为 NARRATOR,利用 LLM 将 SHAP 解释转化为符合用户偏好的自然语言叙述。通过向 NARRATOR 提供 3 至 5 个手写的示例叙述,LLM 可以模仿这些样例的风格生成文字。
Zytek 指出:“与其让用户定义他们需要什么样的解释,不如让他们直接写下想要看到的内容,这样更简单。”
这种方法使 NARRATOR 可以通过不同的手写示例轻松适应新的应用场景。
在 NARRATOR 生成通俗语言解释后,第二部分 GRADER 会利用 LLM 根据四项指标对叙述质量进行评估:简洁性、准确性、完整性和流畅性。GRADER 会自动将 NARRATOR 生成的文字与对应的 SHAP 解释一起输入 LLM 进行验证。
Zytek 表示:“我们发现,即使 LLM 在执行任务时可能出错,它在验证和检查任务时通常不会出错。”
此外,用户还可以根据需求调整 GRADER 中各指标的权重。“比如在高风险场景下,可以优先考虑准确性和完整性,而降低对流畅性的要求。”她补充道。

优化自然语言叙述
对 Zytek 及其团队来说,调整 LLM 以生成自然流畅的叙述是他们面临的最大挑战之一。通常情况下,添加越多的风格控制规则,LLM 越容易在解释中引入错误。
“我们在提示调优上花了很多时间,一次次发现问题并逐个修复。”她说道。
为测试他们的系统,研究人员使用了九个带有解释的机器学习数据集,并让不同用户为每个数据集撰写叙述。他们用这些样例来评估 NARRATOR 模仿不同写作风格的能力,同时利用 GRADER 从简洁性、准确性、完整性和流畅性四个维度对每条叙述进行评分。
最终,研究表明他们的系统可以生成高质量的自然语言解释,并成功模仿不同的写作风格。
研究结果显示,提供少量手写示例显著提升了叙述风格的质量。然而,这些示例需要非常精心编写。比如,加入“更大”之类的比较词汇,可能会导致 GRADER 错误地将准确的解释标记为不正确。
基于这些成果,研究团队计划探索更好的技术,以帮助系统更好地处理比较词。此外,他们希望通过为解释加入逻辑推理功能,进一步扩展 EXPLINGO 的能力。
从长远来看,他们希望将这项研究发展为一个交互式系统,使用户能够就某一解释向模型提出后续问题。
“这在决策过程中非常有帮助。如果用户对模型的预测结果有异议,我们希望他们能迅速判断自己的直觉是否正确,或者模型的直觉是否正确,并找到分歧的来源。”Zytek 解释道。
-
让AI“开口说话”:复杂模型的解释不再晦涩
机器学习模型虽然功能强大,但可能会出错,并且通常难以使用。为了帮助用户了解何时以及如何信任模型的预测,科学家们开发了各种解释方法。然而,这些解释往往十分复杂,可能涉及数百个模型特征,有时还以多层次
2025-05-14 09:33:16 -
Kimi埋头打造AI应用
在仲裁风波中前行的Kimi及其创始人杨植麟,正将目光牢牢锁定在自家AI应用的创新之路上。继上月推出数学模型k0—math后,Kimi再度发力。 12月16日,Kimi揭开了视觉思考模型k1的神秘面纱,该模型基于强化学习技
2025-05-14 09:31:40 -
哲学专家和人工智能领域学者齐聚一堂,首届人工智能哲学与伦理论坛在汉举行
AI如何赋能与向善?12月14日,首届人工智能哲学与伦理论坛在华中科技大学举行。大会由华中科技大学哲学学院主办,旨在加快华中科技大学《人工智能的哲学与伦理》课程建设。围绕“人工智能:赋能与向善”,来自清华
2025-05-14 09:28:28 -
美年健康:大模型与AI Agent赋能 引领医疗人工智能应用
随着科技迅猛发展,人工智能已悄然融入生活各个角落。在12月14日结束的第七场发布上,OpenAI作为全球AI领域的先行者,再次展示了其在人工智能领域持续迭代与创新的强劲势头,从ChatGPT的广泛应用,到后来依次发布
2025-05-14 09:26:52 -
2024中国医学人工智能大会成功举办
12月14日,2024中国医学人工智能大会在上海徐汇成功举办,本届大会以“人工智能赋能医疗卫生健康”为主题。市经济信息化委主任张英出席大会并致辞。 张英表示,上海正在加快实施“模塑申城”工程,推动垂类大模型在医
2025-05-14 09:25:16 -
四川AI医疗又添新成员 AI肿瘤综合解决方案示范中心正式启用
AI技术在各行各业中的运用案例灿若繁星,在医疗这一与民生健康息息相关的领域,AI技术的发展进程更是在“快车道”。 2024年12月16日,四川友谊医院AI肿瘤综合解决方案示范中心正式启用。据了解,中心规划配备联影国
2025-05-14 09:23:40
-
AI周报|OpenAI展示新模型o3;智谱完成新一轮30亿元融资
OpenAI展示新模型o3 当地时间周五,OpenAI在为期12个工作日的新品发布活动的最后一天展示了o1模型的下一代o3,并表示该模型有o3版本和精简版o3-mini。OpenAI会在1月底前正式推出o3 mini,并在之后推出完整版的o3
2025-05-05 22:06:11 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
Stable Diffusion怎么控制表情_AI绘画局部修改表情怎么做_AI绘画局部控制表情教程
给大家带来了一个超级实用的Stable Diffuison绘画小技巧,就是如何用我们之前提到的After Detailer插件来控制生成人像图片的人物表情!
2024-12-24 17:31:46 -
中国气象局部署人工智能气象应用工作时强调 积极推动人工智能与气象业务全面融合
12月30日,中国气象局人工智能气象应用工作领导小组召开2024年第二次会议,听取人工智能气象应用工作进展汇报,审议2025年实施方案和重点任务清单,研究部署下一步工作。局党组书记、局长,领导小组组长陈振林主
2025-05-05 18:20:00 -
这里,何以成为中国西部AI发展高地
电子显示产业、生物医药、新型合成材料及高端装备制造四大主导产业聚链成势,今年上半年实现规上工业总产值201 22亿元; 区内高新技术企业数量从2012年的30家增长到2022年的300家,地方财政科技支出从3617万元增
2025-05-05 22:53:38 -
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
「Music To Image」是一款AI音频生成图片的多模态转换工具,它的本质生成逻辑是音频→文本提示词→图像。
2024-12-17 00:06:33 -
AI会议整理软件_通义听悟使用教程
最近还挺多人在群里问,有没有啥好的总结会议生成纪要的AI,所以今天更新一篇这个教程,也算是补上AI办公的拼图。
2024-12-17 16:12:59 -
只用文本,3分钟生成一个网站!首个ChatGPT版网站开发平台dora AI发布
3月21日,开发平台dora宣布,首个生成式AI网站开发平台dora AI,结束候补内测全面开启公测。
2025-02-06 14:46:19 -
奥特曼官宣OpenAI的2024年产品计划丨百度推出首款AI原生游戏丨文心大模型率先通过国家大模型标准测试
【AI奇点网2023年12月25日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-24 11:36:46 -
超300款生成式人工智能服务已备案,人工智能ETF(159819)等产品受市场关注
人工智能产业指数高开震荡,截至收盘,中证人工智能主题指数上涨1 3%,中证云计算与大数据主题指数上涨0 9%,中证软件服务指数上涨0 2%,国证机器人产业指数上涨0 1%。 国家网信办公告显示,截至2024年底,共
2025-02-27 10:20:23