腾讯AI实验室联合剑桥大学推出大语言模型PandaGPT:支持文本图像音频等跨模态能力
AI奇点网6月6日报道丨6月2日,来自英国剑桥大学、日本奈良先端科学技术大学院大学、腾讯AI Lab的多位研究人员们在网上公开发布了通用指令跟随大模型PandaGPT(直译过来就是:熊猫GPT)。
据介绍,PandaGPT可以执行复杂的任务,如生成详细的图像描述、编写受视频启发的故事、回答有关音频的问题。PandaGPT可同时接受多模态输入,并自然地组合它们的语义。
PandaGPT在文本、图像/视频、音频、深度、热度(thermal)和IMU六种模态上展示了跨模态能力,但由于ImageBind提供的共享嵌入空间,它只能使用对齐的图像-文本对进行训练。研究人员希望PandaGPT可以作为构建通用人工智能(AGI)的第一步,它可以像人类一样全面地感知和理解不同形式的输入。
值得强调的是,目前的 PandaGPT 版本只使用了对齐的图像 - 文本数据进行训练,但是继承了 ImageBind 编码器的六种模态理解能力,具备在所有模态之间跨模态能力。在实验中,论文作者展示了 PandaGPT 对不同模态的理解能力,包括基于图像 / 视频的问答,基于图像 / 视频的创意写作,基于视觉和听觉信息的推理等等,下面其中一个例子,PandaGPT可以很好的接合图像+音频来判断一个事物:

-
腾讯AI实验室联合剑桥大学推出大语言模型PandaGPT:支持文本图像音频等跨模态能力
来自英国剑桥大学、日本奈良先端科学技术大学院大学、腾讯AI Lab的多位研究人员发布了通用指令跟随大模型PandaGPT。
2025-04-24 16:10:57 -
抢占应用落地先机:360智脑大模型应用发布会将于6月13日举行
360智脑是一种自研的千亿参数大语言模型,在测评中体现出了认知智能通用大模型能力。落地应用已陆续成熟,预计很快开放内测。
2025-04-24 15:50:47 -
最高1000万元奖励激励计划!成都市发布人工智能产业发展扶持政策
6月1日,成都市经济和信息化局发布通知,提交《成都市关于进一步促进人工智能产业高质量发展的若干政策措施》征求意见稿
2025-04-24 15:24:52 -
周鸿祎谈AI带来的改变:人工智能将重塑一个360公司
周鸿祎也是对这次科技革命反应最快的大佬之一。他将大模型比喻成“发电”技术一般的技术革命。它的影响不亚于人类发明电灯、人类发明计算机。
2025-04-24 15:04:15 -
AI监管权争夺战打响:英国渴望牵头建立全球人工智能数据安全监管中心
日前,英国首相苏纳克访美时就提及此议题,他与美国总统拜登就人工智能(AI)监管方面的问题展开了讨论。
2025-04-24 14:38:16 -
智源大会产品之一“悟道·视界”:点亮国内绘画通用模型科技树
“悟道·视界”由悟道3 0的视觉大模型团队打造,是一套具备通用场景感知和复杂任务处理能力的智能视觉和多模态大模型系列。6项国际领先技术中,前5个是基础模型,最后1个是应用技术。
2025-04-24 14:12:31
-
AI绘画ComfyUI进阶教程丨如何实现Clip精准控图,流程自动化入门!
大家好,又到学习时刻? 本期跟大家分享CLIP构图相关的一些进阶基础内容,以及自动化逻辑编程基础,希望能对大家有所启发,最后不要忘记支持欧阳一波啦?!
2024-12-17 13:16:14 -
阿里寻光_寻光视频创作平台_寻光视频创作官方网站
AIGC时代,视频创作这事儿真的不一样了。就像这样,轻轻一圈,选定目标立刻变身单独图层,再丝滑嵌入不同的背景视频,场景变换so easy~
2025-01-16 11:04:19 -
有手就行:Stability AI推出简笔画生成图片工具Stable Doodle
近日,图像生成模型 Stable Diffusion 背后的初创公司 Stability AI 推出了一项新的服务,可以将简笔画转换为图像。这项服务名为 Stable Doodle,利用最新的 Stable Diffusion 模型分析简笔画的轮廓,让每个人都能得到堪称艺术的作品。
2025-04-10 13:09:46 -
AI动漫视频生成_yoyo官方网站_yoyo功能及介绍
视频生成赛道又起新秀,而且还是二次元定制版!稳定产出电影级画面,一键文 图生成视频,即使是「手残党」也能复刻自己喜欢的动漫作品了。
2025-01-16 11:53:08 -
阿里云通义千问上线AIGC春节新玩法:AI帮你免费拍摄全家福,AI舞蹈视频生成器“全民舞王”新增春晚舞蹈
春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法。
2025-02-13 15:39:26 -
应用商店下载排行第一,“Meta版推特”Threads注册用户超5000万
新上线社交应用Threads已注册激活用户超过5000万,该数字仍在持续增长。当前在英国和美国苹果应用商店免费应用中的下载量排名第一。
2025-04-14 13:36:13 -
大语言模型「新王」Claude 3全面测评:原生多模态大模型各项能力实力超群,连打麻将都学会,实测比GPT-4好用
OpenAI「不可战胜」的神话,看样子是要被打破了。Claude 3的多版本发布后,“中杯”Sonnet直接免费体验,“大杯”Opus充个会员也能即刻享受,各路测评纷至沓来。
2024-12-13 18:57:45 -
AI写真生成器妙鸭相机免费体验版实测_仅需8张自拍
在小红书、朋友圈刷屏的“妙鸭相机”,还记得吗?9月20日,这家AI快消应用公司宣布“妙鸭相机”免费体验版本正式上线啦!本次更新的“妙鸭相机”APP,专业版要求上传的图片数量也从20张下调到15张了哟
2024-12-16 09:21:10 -
网易出品的免费AI在线绘画工具:AI绘画工坊,安利给大家
网易出品推出的云端Stable Diffusion简直太好用了,集成了多种模型任你选,想生成什么类型的图像都超级容易。
2024-12-16 09:26:04 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30