谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务
近日谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务。
其中一款名为 Gemini Robotics,是一款视觉语言行动模型,能够使机器人在没有进行过专门训练的情况下理解新的情境。
Gemini Robotics 基于谷歌最新版本的 AI 旗舰模型 ——Gemini 2.0。谷歌 DeepMind 机器人部门高级总监 Carolina Parada 曾表示,Gemini Robotics 依托 Gemini 的多模态世界理解能力,通过加入物理行动的新模态,将其应用到现实世界中。
该模型在谷歌 DeepMind 认为构建高效机器人所需的三大核心领域取得了进展:通用性、互动性和灵活性。除了能够应对新的情境外,Gemini Robotics 在与人类及环境的互动上表现更好,且能够执行更精确的物理操作,比如折纸或打开瓶盖。
另一款则是 Gemini Robotics-ER(具象推理)模型,公司称其为一种先进的视觉语言模型,能够“理解复杂且动态的世界”。
Parada 进一步解释道,当你在装便当盒时,桌上的物品摆放位置和如何操作是你必须考虑的内容。Gemini Robotics-ER 正是为此类推理任务而设计,机器人专家可通过该模型与现有的低级控制系统对接,开启由 Gemini Robotics-ER 驱动的新功能。
谷歌 DeepMind 的研究员 Vikas Sindhwani 表示,公司正在开发一种“分层安全策略”,并称 Gemini Robotics-ER 模型已被训练用于评估在特定情况下某个动作是否安全。公司还发布了新的基准和框架,推动 AI 领域的安全研究。据IT之家了解,去年,谷歌 DeepMind 推出了“机器人宪法”,这是一套受艾萨克・阿西莫夫启发的机器人行为规范。
据外媒 The Verge,谷歌 DeepMind 与 Apptronik 合作,共同致力于“打造下一代人形机器人”。此外,谷歌还向包括 agile Robots、Agility Robotics、波士顿动力和 Enchanted Tools 在内的“受信任的测试者”开放了 Gemini Robotics-ER 模型。Parada 表示:“我们专注于打造能够理解物理世界并在其中行动的智能,我们非常期待将这一技术应用于多个领域和多种表现形式。”
-
谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务
近日谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务。 其中一款名为 Gemini Robotics,是一款视觉语言行动模型,能够使机器人在没有进行过专门训练的情况下理解新的情境。 Gemini
2025-04-17 09:06:16 -
360周鸿祎:大部分企业只需要百亿参数模型即可,多了浪费
本文讨论了构建安全可信的人工智能以及人工智能赋能百行千业的主题。文章提到了360自研的认知大模型智脑在该领域的探索,并分享了一些实践中得到的经验和思考。
2025-04-17 09:05:48 -
李彦宏:大模型即将重塑数字世界,文心大模型更新至 V3.5版本
百度创始人、董事长兼首席执行官李彦宏在世界互联网大会的演讲中强调了大模型在重塑数字世界方面的重要性。他指出大模型是全球科技创新的焦点和人工智能竞赛的主战场,同时带来了数字经济发展的巨大机遇和治理挑战。
2025-04-16 17:23:12 -
上海市公安局闵行分局近日破获一起犯罪团伙利用AI生成美女视频
上海市公安局闵行分局近日破获一起犯罪团伙利用AI生成美女视频,“广撒网式”的电信网络诈骗案,涉案资金200余万元。 市民刘先生是受害者之一。2024年6月,刘先生通过一则短视频结交了网友“焦女士”,并发展为恋人
2025-04-16 17:21:33 -
警惕:AI视频渗透老年朋友圈,假孙子、情感代偿和新时代微商
「发财了,一个视频回本,收益300多。」一位群友在群里发布了自己的视频号截图。另一位群友不语,只是发布了自己同话题的视频,显示收益800多。 群主此时发来拇指点赞,适时总结:「动物警示现在很猛。」 「
2025-04-16 17:00:58 -
阿里巴巴张勇:人工智能技术必须符合社会规范,为人类带来更多美好
阿里巴巴集团董事会主席兼首席执行官张勇在世界互联网大会数字文明尼山对话主论坛上表示,人工智能技术的发展必须符合社会规范,为人类创造更多美好。他指出人工智能在中国具备基础扎实、场景丰富、数据实践融合等优势,而构建安全可信的人工智能已成为行业共识,相关法律法规正在完善。
2025-04-16 16:56:35
-
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
「Music To Image」是一款AI音频生成图片的多模态转换工具,它的本质生成逻辑是音频→文本提示词→图像。
2024-12-17 00:06:33 -
钉钉发布V7.5版本:首次推出AI个人助理产品「超级助理」,人人都可以创建专属的AI助理并上架应用市场
钉钉举行V7 5版本的迭代产品发布会,钉钉正式发布了基于70万家企业需求共创的AI助理产品,推动AI的使用门槛进一步降低,让人人都能创造AI助理。
2025-02-19 14:21:28 -
跟人类学孬了!联合国:AI大模型的回复存在严重的性别偏见、种族偏见与刻板印象等问题
报告指出,女性在大模型的描述中,从事“家务劳动”的频率是男性的4倍,而男性名字则与“商业”、“管理层”、“薪水”和“职业”等词汇联系在一起。
2025-02-08 12:52:22 -
?新年新气象!小红书推出AI人物头像绘图模型「InstantID」:轻松打造龙年新春头像,一键免费焕新
近日,小红书团队推出了一款AI头像生成工具「InstantID」,直接刷屏了。使用门槛较低。只需要用户提供一张自拍照就可以轻松生成一大波风格迥异的照片。
2025-02-13 14:27:20 -
阿里旗下夸克APP上线“AI学习助手”:内置海量试题,拍照一键解疑,巧用大模型帮助当代学子高效备考、快速进阶
夸克“AI学习助手”采用夸克宝宝的虚拟形象为用户进行题目讲解。基于大语言模型和视觉技术,AI智能讲解能够给用户提供 “考点分析”、“详解步骤”、“答案总结”等详细内容。
2025-02-18 16:08:16 -
AI概念股表现强势 Arm Holdings(ARM.US)涨超14%
周三,AI概念股表现强势,Arm Holdings(ARM US)涨超14%,甲骨文(ORCL US)、戴尔科技(DELL US)涨超7%,C3 ai(AI US)涨超6%。消息面上,美东时间周二,在当晚的白宫活动中,特朗普宣布,OpenAI、软银和甲骨文将成立
2025-02-25 17:23:06 -
微博推出“明星AI情感伴聊”:模拟你喜欢的爱豆来陪你聊天,演员李兰迪已进驻
用户向明星发送私信,专属的AI助手将模拟明星的聊天方式和风格进行自动回复,以情感陪伴提升用户体验。微博将陆续邀请更多明星开启该功能。
2025-04-04 10:51:09 -
AI绘画ComfyUI进阶教学丨Mask遮罩基础运用,IPA+CN+Lora+prompts+遮罩
本期开始正式进入遮罩相关的高级应用,这里我们会尝试为不同组件应用不同区域的遮罩,实现构图、效果的不同区域实现。希望本期内容能对大家有所帮助和启发,最后如果喜欢欧阳的教程就千万不要忘记支持一波啦!!!
2024-12-17 09:48:56 -
Suno ai全面使用指南丨AI音乐GPT时刻来临,人人都能成为音乐大师!
最近,AI 音乐的 ChatGPT 时刻来临啦!一款音乐 AI神器——Suno V3发布,引发了广泛关注。这款AI音乐工具凭借其独特的创新,持续占据各大平台热搜榜首。
2024-12-17 20:54:47 -
2D转3D成熟倒计时!2023(最全)AIGC-3D技术总结,一个视频搞懂AI生成3D模型
2023年我们见证了AI生成图像的快速进化,同样在这一年,AI生成3D虽然相对之下默默无闻,但也出现了很多重要的技术,实现了从0到1的突破。相信2024年一定会迎来AI生成3D技术的突飞猛进。这个视频我们一起看一下2023年AI生成3D有哪些重要工作,提前了解。为后面的成熟做好准备。
2024-12-18 14:25:53