如何构建可信赖的AI系统
近期,国内外一些人工智能(AI)产品问答内容价值导向错误的新闻频上热搜。随着AI技术的发展,AI的价值导向问题逐渐引发广泛关注,“构建可信赖的AI系统”的呼声越来越高。日前在2024年世界科技与发展论坛期间发布的《2024年人工智能十大前沿技术趋势展望》,就列入了“人机对齐:构建可信赖的AI系统”。2024年世界互联网大会乌镇峰会也聚焦AI,释放清晰信号——拥抱以人为本、智能向善的数字未来。
什么是可信赖的AI系统?构建可信赖的AI系统有哪些路径?科技日报记者就以上问题采访了相关专家。
可靠稳定是关键
随着AI在社会生活和各个行业中渗透程度的加深,其决策和行为的影响范围也日益扩大。例如,在医疗、交通、金融等高风险领域,AI系统的决策影响着人们的生命、财产与福祉,一些错误决策可能直接威胁到人类生命或财产安全。康奈尔大学约翰逊商学院讲席教授丛林介绍,AI在金融领域的应用主要包括资产管理、资产回报预测、资产定价等。“我们希望金融领域的AI要准确。我们并不需要它有发散思维或特别有创造力,而是希望它能给我们准确的答案,或是具有一定的稳健性。”他说。
“确保AI系统可信赖,已经成为AI发展不可忽视的要求。这不仅是技术层面的改进,更是社会伦理与责任的体现。”中国科学技术大学人工智能与数据科学学院教授王翔认为,可信赖AI系统不仅能让技术更好地满足人类需求,还能有效防范AI误判和偏见可能引发的负面效应。可信赖的AI系统不但要有优秀的预测、生成、决策等业务能力,而且在透明度、公平性、可解释性、安全性等方面也要符合用户预期。
其中,可解释性是指用户应能够理解AI的行为和决策流程,以便增强用户对AI的信任,并更好地加以利用。公平性要求AI的决策不应受到偏见影响,避免形成对不同群体的歧视。安全性则是指AI系统在运行过程中不会带来安全隐患,并能在一定范围内控制自身行为,特别是在极端或意外情况下要能保护人类安全。“AI系统还需要具备可靠性和稳定性,这要求它的表现在复杂和变化的开发环境中也要始终如一,不轻易受到外部因素干扰。”王翔说。
人机对齐是前提
那么,如何确保AI系统可信赖?王翔认为,人机对齐与构建可信赖的AI系统之间关系密切。“只有具备人机对齐特质的AI系统,才能进一步实现可信赖的特性。”他说。
从概念上看,人机对齐是指确保AI系统在执行任务、进行决策时,其行为、目标和价值观能够与人类保持一致。“这就是说,AI系统在自我优化和执行任务过程中,不仅要高效完成任务,还要符合人类的伦理和价值体系,不能偏离人类设定的目标或带来不良的社会影响。”王翔进一步解释,“尤其是在涉及社会伦理和安全的场景中,确保AI输出内容与人类的价值观和道德准则相符,是人机对齐的核心意义。”
如果AI系统没有经过人机对齐的过程,即使具备强大的功能和智能,也可能因不符合人类的期望和价值观而导致信任危机或负面影响。“因此,确保AI系统在目标和行为上与人类保持一致是构建可信赖AI系统的重要前提。两者的结合不仅能提升AI的表现,还可为未来AI在各领域的广泛应用奠定基础。”王翔说。
确保AI以人为本、智能向善,完善伦理和法律框架是重要发力方向。王翔认为,技术的进步往往伴随着新问题的发生,因此需要设立法律边界和伦理准则,为AI的发展提供指导与约束。这不仅可以减少ai应用中潜在的伦理风险,还能使AI应用更加规范和安全。此外,建设可信赖的AI系统需要跨学科合作,哲学、伦理学、社会学等学科的参与能为AI的设计与发展提供更全面的视角。
技术优化是手段
构建可信赖的AI系统,还需要在技术层面和应用实践中不断探索和完善。王翔介绍了三种主要的技术路径。
一是数据驱动路径。王翔认为,数据质量和多样性是实现可信赖AI的基础。训练数据的多样性可以有效减少模型中的偏见问题,确保系统决策更加公平、全面。“只有在庞大的优质数据基础上构建的AI模型才能适应广泛的应用场景,降低在特殊或极端条件下出现偏见的可能性。”王翔说,数据的安全性也至关重要,尤其是在涉及个人隐私的领域,保障数据安全可以提高用户信任度。
二是算法驱动路径。王翔说,算法的优化与控制是实现可信赖AI的关键手段。在模型的设计阶段,开发者可以通过设置伦理规则、嵌入人类价值观等约束条件,确保系统在实际运行中符合社会准则。同时,设计透明的算法结构有助于提升模型的可解释性,便于用户理解其运行机制,并为未来的模型更新和优化打下基础。
三是奖惩引导路径。王翔说,通过合理设计奖惩机制,可以让AI在不断试错和学习过程中,逐渐形成符合人类价值观的行为方式。例如,可以在奖惩系统中设置反馈机制,当AI的行为偏离预期时施加相应惩罚,引导其在自我训练过程中符合人类期望。同时,奖惩机制需具备时代适应性,确保AI系统能在运行中持续更新并优化自身。
这三种技术路径的侧重点各有不同。王翔解释,数据驱动路径主要聚焦于通过高质量、多样化的数据源减少AI系统的偏见,提升系统的适用性;算法驱动路径更注重模型的设计和透明性,使系统在行为逻辑上更符合人类预期;奖惩引导路径则侧重于在AI自我学习和优化过程中提供有效指引和反馈,让系统逐渐趋向人类认可的方向。“不同路径相结合,可以为实现可信赖的AI提供更加丰富的技术支持。”王翔说。
要构建可信赖的AI系统,还需在实际应用中不断进行迭代和优化。“通过多次评估和测试,可以在不同环境和条件下验证AI系统的性能,确保其在现实应用中的表现符合人类预期。”王翔说。
-
如何构建可信赖的AI系统
近期,国内外一些人工智能(AI)产品问答内容价值导向错误的新闻频上热搜。随着AI技术的发展,AI的价值导向问题逐渐引发广泛关注,“构建可信赖的AI系统”的呼声越来越高。日前在2024年世界科技与发展论坛期间发布
2025-05-25 15:54:49 -
全球科技巅峰之战!全市场首只创业板人工智能ETF今日光速首发
11月23日,英伟达创始人黄仁勋在出席香港科技大学学位颁授典礼时发表演讲称:“人工智能无疑是我们这个时代最重要的技术,整个世界都被重置(reset)了。我们这个时代面临的最大的挑战,过去看似难以克服的挑战,
2025-05-25 15:30:49 -
如何最大化AI价值?华为云:技术摸高和行业落地双管齐下
过去两年,以大模型为代表的新一代人工智能浪潮,在全球的发展中展现出蓬勃活力和巨大潜力。AI已不仅仅是技术进步的象征,更已成为国家战略中的核心要素。 在乌镇峰会期间,众多前沿AI产品亮相,行业专家齐聚一
2025-05-25 15:06:50 -
本科就在人工智能顶级会议发表论文,他从江大直博香港科技大学
他大一便加入实验室,发表9篇外文论文,其中1篇人工智能顶级会议论文,3篇SCI期刊论文;他还领衔或参与申请2项国家发明专利,13项软件著作权、成果转让达十余万元;他还是武汉大学、香港大学、伊利诺伊大学厄巴纳
2025-05-25 14:42:49 -
华为云:构筑AI技术生态 助推智能经济发展
过去的一年,人工智能(AI)成为全球热点,全球AI领域的投资和初创企业数量屡创新高,物理世界和数字世界加速融合,智能经济正成为全球经济增长的强大引擎。华为云高度关注智能经济发展趋势,提前布局、向
2025-05-25 14:18:49 -
人工智能超算中心即将投入服务!这一高峰会今日在香港举办
11月26日,由香港生产力促进局举办的粤港澳大湾区国际人工智能与机器人高峰会2024(以下简称“高峰会”)上,一批国际学者、业界代表就先进制造、新能源、生命健康科技、大语言模型等热门议题分享前沿科技发展及应
2025-05-25 13:30:50
-
AI视频后期消除对象神器ProPainter:一涂一抹,视频轻松移除指定对象丨本地离线一键部署
今天给大家介绍一款超强的一键删除视频内的移动物体和去除视频水印的工具ProPainter。本地部署比较麻烦,已经为大家制作好了离线整合包,解压即用。
2024-12-19 17:43:32 -
WPS AI应用教学_WPS智能文档AI模板使用锦囊:小众但好用!效率翻倍
WPS在文字、表格、演示等多个组件中,已展现了AI在办公领域的魅力。今天先给大家介绍一个可能被很多人忽视,但很好用的AI模板。
2024-12-23 09:33:26 -
苹果推送iOS 18 Beta8测试版,新增AI照片消除丨英伟达发布Q2财报,AI业务刺激醒目丨OpenAI开展新一轮融资洽谈
【AI奇点网2024年8月29日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-13 16:10:25 -
阿里云通义千问上线AIGC春节新玩法:AI帮你免费拍摄全家福,AI舞蹈视频生成器“全民舞王”新增春晚舞蹈
春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法。
2025-02-13 15:39:26 -
网易云音乐内测“AI私人DJ”功能,智能推荐歌曲,做你专属的智能音乐助手
网易云音乐在五月内测上线“私人DJ”功能了,目前仅对部分用户开放内测,该功能基于歌曲推荐算法的创新升级,实现了推荐歌曲的智能讲解服务。
2025-04-10 10:49:53 -
Google 将AI聊天机器人添加到搜索引擎中,正式应战ChatGPT
谷歌CEO Sundar Pichai透露,谷歌计划在自家旗舰搜索引擎中添加AI对话功能,以应对ChatGPT等聊天机器人带来的竞争及商业压力。
2025-05-01 07:49:29 -
美年健康:大模型与AI Agent赋能,引领医疗人工智能应用
随着科技迅猛发展,人工智能已悄然融入生活各个角落。在12 月 14日结束的第七场发布上,Open AI 作为全球AI领域的先行者,再次展示了其在人工智能领域持续迭代与创新的强劲势头,从ChatGPT 的广泛应用,到后来依
2025-05-14 16:25:21 -
财经三人谈:“人工智能泡沫”,现在到底有多大?
编者的话:伴随着近期苹果、微软、英伟达等美国科技股的集体大跌,“人工智能(AI)会是下一个泡沫吗”成为科技界、投资界热议话题。自2022年ChatGPT聊天机器人问世以来,全球AI领域迎来研发和投资热潮,一些经济学
2025-05-15 09:28:43 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30