AI“破圈”加速步入物理世界
从实现爆发性发展的语言智能,到初步显现巨大潜力的空间智能——展望2025年的人工智能行业,世界模型、合成数据、具身智能等引领行业前沿的方向,有望将人工智能的“洪荒之力”从虚拟世界加速拓展到物理世界,成为驱动AI行业发展的重要驱动力。
世界模型探索AI新前沿
刚刚过去的12月,“世界模型”成了AI行业热词,所谓世界模型,是指AI系统用来表示和理解外部世界运行规律的内部模型,通过大量图像、音频、视频和文本数据训练得来。近来,国内外世界模型成果频频。去年12月初,有“AI教母”之称的斯坦福大学教授李飞飞在同年组建的World Labs发布大型世界模型;谷歌DeepMind发布新一代世界模型Genie 2;Meta推出了导航世界模型NWM;此前智源研究院发布全自研原生多模态世界模型Emu3,实现了视频、图像、文本三种模态的统一理解和生成。
“有经验的老司机在开车时,对‘鬼探头’等状况会有预判,这得益于人通过规则学习建立了一个简化的世界驾驶模型。”极佳视界联合创始人兼首席科学家朱政说。
李飞飞将人类智能归结为两大智能,一是语言智能,二是空间智能。她认为,如果想让AI超越其自身当前能力,人们需要可以行动的AI。“我们需要从大型语言模型转向大型世界模型。”她说。
智源研究院在近日发布的2025十大AI技术趋势中提出,作为赋予AI更高级别的认知、适应和决策能力的技术,世界模型有望突破传统的任务边界,探索人机交互的新可能。“解决空间智能问题是关键一步。在2025年,空间智能的界限很可能会再次突破。”李飞飞说。
合成数据欲破“数据瓶颈”
数据,如同AI大模型的“血液”和“燃料”,其质量与数量直接决定了模型性能的上限。然而,随着大模型急速发展,近来人们不得不面临一个问题——能够用来“喂”给大模型的高质量数据越来越少了。
马斯克近日接受采访时表示,现实世界中能用来训练AI模型的资料,已经消耗得差不多了。《自然》《麻省理工科技评论》等多家科技杂志也提出,滋养无数模型成长的传统数据集正被大语言模型开发人员过度“开垦”。据人工智能研究机构Epoch AI的报告,在2026年以前,AI训练将用尽互联网上包含音视频在内的高质量数据,而现存真实数据集或将在2030年至2060年间耗尽。
除了“不够用”,现实世界数据还存在“不好用、不能用”等情况,数据质量参差不齐,可能使模型分析结果产生偏差。同时,随着监管加强,对个人信息等数据的保护力度加大,数据获取会戴上“紧箍咒”。
合成数据,成为业界探索解决人工智能未来发展“数据瓶颈”的解药。所谓合成数据,是指通过计算机算法生成的模拟数据,它不直接来自于现实世界。“合成数据将成为大模型迭代与应用落地的重要催化剂”,智源研究院在2025十大AI技术趋势中写道。
“暴雪天气、行人突然闯入道路……有很多危险驾驶场景很难在物理世界真实采集,因此我们需要合成数据。”一位自动驾驶从业者告诉记者。
在智源研究院看来,合成数据可以降低人工治理和标注的成本,缓解对真实数据的依赖,不再涉及数据隐私问题。此外,合成数据可以缓解通用数据被大厂垄断、专有数据存在获取成本等问题,促进大模型的应用落地。
具身智能或进入爆发“元年”
“通用机器人的时代即将到来,这将是世界上有史以来最大的技术产业。”在近日举行的国际消费类电子产品展览会(CES)开幕式上,英伟达创始人兼首席执行官黄仁勋说。在他看来,AI的下一个前沿方向就是“物理AI”,其中蕴藏着价值数万亿美元的机会。
2024年,全球范围内具身智能机器人竞争日益白热化。截至去年底,国内发布或者在研人形机器人厂商接近100家,融资已超过100亿元,被行业内戏称为“百人大战”或“百机大战”。CES开幕式上站在黄仁勋身后的14台具身智能机器人中,就有6台来自中国。
智平方创始人兼CEO郭彦东认为,从高危作业到重复性任务,再到家庭日常,具身机器人将在未来5到10年全面融入社会生活,重塑每一个行业的运作模式。
智源研究院预测,2025年将进入“具身智能元年”,近百家具身初创企业或将迎来洗牌,厂商数量将开始收敛。技术路线上,端到端模型继续迭代,“小脑”大模型的尝试或有突破,在商业变现上,更多的具身智能应用将在工业场景落地,部分人形机器人将迎来量产。
-
AI“破圈”加速步入物理世界
从实现爆发性发展的语言智能,到初步显现巨大潜力的空间智能——展望2025年的人工智能行业,世界模型、合成数据、具身智能等引领行业前沿的方向,有望将人工智能的“洪荒之力”从虚拟世界加速拓展到物理世界,成为驱
2025-04-29 16:31:29 -
OpenAI正在秘密开发多模态大模型丨谷歌Bard机器人提供插件支持丨火山引擎发布AI赋能的数智分析平台
【AI奇点网2023年9月20日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-29 16:28:31 -
助力医疗AI数字化转型,百度发布国内首个“产业级”医疗大模型:灵医大模型
百度对外发布国内首个“产业级”的医疗AI大模型:灵医大模型,并面向大健康上下游产业开放灵医大模型测评及试用。
2025-04-29 16:06:36 -
山西证券:国内外算力需求持续强劲 AI有望从云端走向端侧
山西证券研报称,国产AI芯片有望在政策支持和算力市场的需求推动下加速国产替代,同时以豆包AI大模型为基础的多款AI应用持续推出落地,看好AI端侧空间被打开。展望2025年,国内外算力需求持续强劲,AI有望从云端
2025-04-29 16:04:44 -
佳能推出两款图像AI处理工具:提供消除马赛克、降噪与画质提升三大功能
佳能中国官方发布消息称,正式对消费者推出两款神经网络应用工具软件,主要面向专业的制图师与、摄影发烧友、摄影师及其影像工作室等人群。
2025-04-29 15:41:20 -
“险些上当” 泰国总理透露亲历AI骗局 提醒公众提高警惕
△泰国总理佩通坦(资料图) 泰国总理佩通坦15日对媒体透露,自己也曾遭遇诈骗,对方利用人工智能技术(AI)模拟东盟某国领导人的声音,并以“国家”名义诱骗其捐款,自己险些上当。她以此 提醒公众对电信诈骗提高警
2025-04-29 15:37:58
-
大语言模型「新王」Claude 3全面测评:原生多模态大模型各项能力实力超群,连打麻将都学会,实测比GPT-4好用
OpenAI「不可战胜」的神话,看样子是要被打破了。Claude 3的多版本发布后,“中杯”Sonnet直接免费体验,“大杯”Opus充个会员也能即刻享受,各路测评纷至沓来。
2024-12-13 18:57:45 -
阿里旗下夸克APP上线“AI学习助手”:内置海量试题,拍照一键解疑,巧用大模型帮助当代学子高效备考、快速进阶
夸克“AI学习助手”采用夸克宝宝的虚拟形象为用户进行题目讲解。基于大语言模型和视觉技术,AI智能讲解能够给用户提供 “考点分析”、“详解步骤”、“答案总结”等详细内容。
2025-02-18 16:08:16 -
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
「Music To Image」是一款AI音频生成图片的多模态转换工具,它的本质生成逻辑是音频→文本提示词→图像。
2024-12-17 00:06:33 -
ChatGPT怎么本地登录_GPT怎么使用_GPT本地项目
本期就ChatGPT的这次更新再次将完全新人使用指南提上日程,并对此次更新做些设想和想象。希望大家喜欢!
2024-12-19 07:41:20 -
Stable Diffusion怎么控制表情_AI绘画局部修改表情怎么做_AI绘画局部控制表情教程
给大家带来了一个超级实用的Stable Diffuison绘画小技巧,就是如何用我们之前提到的After Detailer插件来控制生成人像图片的人物表情!
2024-12-24 17:31:46 -
钉钉发布V7.5版本:首次推出AI个人助理产品「超级助理」,人人都可以创建专属的AI助理并上架应用市场
钉钉举行V7 5版本的迭代产品发布会,钉钉正式发布了基于70万家企业需求共创的AI助理产品,推动AI的使用门槛进一步降低,让人人都能创造AI助理。
2025-02-19 14:21:28 -
陆洪磊、陆庆悠:打破AI谣言“黑箱”,需要社会共治
前段时间的日喀则地震牵动了全国人民的心,一组“小男孩被埋”的图片也引发广泛关注。然而经警方查证,这组图片实为人工智能(AI)工具创作,原图发布于2024年11月,在地震发生后被造谣者利用。 无独有偶,美国加州
2025-02-27 17:42:13 -
网易有道云笔记推出AI助手,帮你一键写文章列大纲,轻松改写重写
网易有道云笔记日前更新7 2 6最新版,新增了AI助手的新版块,AI 助手支持头脑风暴、写文章、写大纲、列待办事项等操作。
2025-04-08 16:22:58 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
MoonValley使用教程_AI视频怎么生成
本文为大家介绍一款视频生成 AI 工具 Moonvalley,只需简短的提示词,即可产生 16:9 的电影质感片段。接下来让我们来试一试吧。
2024-12-18 12:06:09