谷歌发布AI视频全能模型Lumiere_迄今为止最强大,画质逆天,水时长第一,流畅一塌糊涂
岁末年初,“硅谷卷王”谷歌再次释出王炸新模型!这次聚焦AI视频生成赛道,要说今年不出一部AI大片我是不信的!
当地时间1月23日,谷歌发布名为Lumiere的新模型,采用了最先进的[时间↔空间]U-Net架构,可以生成高度一致性的完整视频片段。
废话不多说,直接上官方宣传片:
谷歌所谓的「U-Net架构」,简而言之就是在训练大模型的时候,在空间与时间两个维度同时采样,减少AI的“发散思考”,增强画面稳定性,能显著拉长生成视频的长度和质量。
这是谷歌AI团队历时7个月打磨的首个全能视频模型。
长期以来,AI视频生成一直存在诸多的缺陷:运动连贯性和一致性很低,卡成PPT,叠影重重等一系列问题。??
谷歌自研的UNet架构可以生成5秒的视频,比竞品Runway与Pika要多一两秒。
更为重要的是,谷歌视频模型可以生成80帧的片段!不仅画质好、质量高,而且时长更长。
我们来看一些实际案例:
虽然还存在一些瑕疵,但作为首个落地模型已经相当不错了。
谷歌Lumiere视频模型不仅本领强,而且功能更加丰富,效果拔群!
视频局部编辑
这项功能可以让剪辑师快速针对视频画面当中的物体进行替换。
比如这个穿着绿色花点裙的女子,只需选中衣服的区域,输入几个简单的提示词文字,AI系统能瞬间将她的裙子换成红白条纹长裙、金色礼服。
正在晨跑的少女,让她长满鲜花,或者进行风格迁移,将其变成木砖风、折纸风、乐高风。
你甚至可以针对更小的对象进行修改和编辑。
比如,让?猫头鹰戴上眼镜。
视频画面修复
除了修改画面的内容,甚至还可以针对损失局部画面的视频进行填充修补。
右下角的这个案例,充满想象力的AI系统画出了一块毫无破绽的慕斯蛋糕。
文本生成视频
除了视频编辑功能,谷歌Lumiere自然也支持从文本生成视频片段。
画一个在火星基地周边漫步的宇航员。
画一只戴着太阳镜被车拉着走的小狗。
画一座废弃的庙宇,在遗迹中穿行。
图像生成视频
谷歌Lumiere另外一个非常好用的功能,便是将静态图像转换为动态视频。
输入提示词「姑娘微笑和眨眼」?,戴珍珠耳环的少女从名画中走出,咧嘴笑了起来。
梵高《星空》,以令人不可思议的方式流动起来。
图像风格化迁移生成视频
除了一般的“图生视频”,谷歌Lumiere模型还能根据参考图生成特定风格的动态艺术视频。
比如,传一张夜光蘑菇图?,生成各种散发荧光的动物。
再看几个别的案例,生成的视频风格复刻得非常精准。
这对于那些技艺较浅的普通视频作者真是降维打击。
运动笔刷
看到这四个字,熟悉AI视频创作的家人们想必马上联想到Runway Gen-2模型正在内测的相似功能。
?相关阅读:
AI视频可控性里程碑:Runway Gen-2上线「多重运动笔刷」大量实战案例:一键可让五个物体以不同形式运动
AI视频可控性里程碑更新:1月18日,Runway上线了多重运动笔刷,这个功能可以单独控制最多五个笔刷选定的区域。让我们看看那些优秀应用案例。
-
谷歌发布AI视频全能模型Lumiere_迄今为止最强大,画质逆天,水时长第一,流畅一塌糊涂
当地时间1月24日,谷歌发布旗下第三款视频模型Lumiere,这是一款先进的模型,专门用于将文本转换为视频,谷歌采用了一种创新的[空间-时间]U-Net架构。
2025-02-18 10:26:25 -
创业板人工智能创历史新高!“159363”暴涨超5%领跑同类!算力硬件大幅反攻,光模块龙头涨超8%
2月7日,人工智能概念继续上攻,CPO等AI硬件大幅反攻,创业板人工智能指数上涨5%创历史新高!成份股悉数飘红,AI产业三件套“硬件+软件+应用”概念股纷纷上扬。算力硬件方面,新易盛(300502)、中际旭创(300308)纷纷
2025-02-18 10:22:06 -
三星在国内发布Galaxy S24系列旗舰手机,嵌入大模型服务Galaxy AI:携手百度、美图、金山WPS推出
在国内市场,三星针对Galaxy AI服务做出了一些“本地化”的处理,选择了包括百度、美图、金山在内的中国企业进行合作。
2025-02-18 10:03:25 -
AI热潮催动电力需求激增 燃气轮机行业迎发展“东风”
为满足日益增长的AI服务需求,数据中心建设“快马加鞭”,由此带来的电力需求问题引发市场关注。据市场调查机构Gartner(高德纳)预测,到2027年,40%的现有AI数据中心将因电力供应不足而导致运营受限。 AI数据中心
2025-02-18 09:55:47 -
谷歌Chrome浏览器升级全球唯二「AI浏览器」:文本创作、壁纸生成…打工人超实用,一篇细数掌握
当地时间1月23日,谷歌官方发布消息:全球最受欢迎的谷歌Chrome浏览器将引入三项基于AIGC开发的新功能。新功能也将依托Gemini新模型打造。
2025-02-18 09:34:54 -
2025年“云”展望:AI、出海、下沉市场或迎“黄金期”
进入2025年,两则关于AI的消息,开启了市场对2025年云行业的畅想。 一是腾讯云于1月16日宣布开设腾讯混元训练营,首期计划招募50家合作伙伴,聚焦大模型产品及应用场景共创,吸引了150多家企业报名,展现了“云+A
2025-02-18 09:30:52
-
阿里“通义听悟”升级:支持6小时超长视频内容解析提问,还可一键生成巨幅思维导图
阿里通义大模型应用产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。
2025-02-06 16:53:33 -
腾讯发布混元大模型原生AI应用「腾讯元宝」,已接入微信搜一搜,覆盖公众号内容生态
腾讯宣布旗下的主力大模型混元大模型全面升级,基于混元大模型打造了首个面向消费用户的APP「腾讯元宝」正式上线。
2025-01-21 14:37:34 -
AIGC基础应用教程丨探索AI在图像放大中的工具使用
当给到的图像素材尺寸太小或者不清晰的时候,有哪些好的AI图像放大的工具可以使用?本期就给大家推荐一些好用的工具
2025-02-06 14:24:28 -
国内大模型创企“月之暗面”发布Kimi模型重磅升级:扩容200万字上下文窗口,新增「继续」延长回复按钮
国内人工智能大模型创业公司“月之暗面”终于有了一次面向媒体的公开活动。发布了更长上下文窗口的版本:200万字上下文版本,即日起可在Kimi Chat上开启内测。
2025-02-06 17:17:20 -
小米公司开启小爱AI大模型多模态能力内测:支持图片内容问答、AI扩图、消除路人,适配小米14、Redmi K70等
3月15日,小米官方宣布小米社区开启新一轮的小爱AI大模型内测。现已开启“小爱同学多模态功能内测”。
2025-02-07 13:53:52 -
硅谷版“罗密欧与朱丽叶”:马斯克vs奥特曼的爱恨情仇丨从兄弟同心到对薄公堂,8年发生了什么?
硅谷版“罗密欧与朱丽叶”故事正在上演,马斯克是奥特曼的引路人,但让OpenAI获得今天的成功,奥特曼成为科技圈的新晋网红,决定性因素在于微软的入局。
2025-02-08 13:18:00 -
GPT-4上线一周年纪念日,OpenAI投资的机器人闪亮登场,这是我们目前能看到最接近终结者的样子
一家OpenAI投资的机器人初创公司Figure AI发布一段人形机器人的演示视频,一台基于GPT-4大模型开发,被命名为「Figure 01」的机器人横空出世。
2025-02-08 15:55:02 -
科大讯飞星火大模型3.0实测:高能进化,给AI注入灵魂,部分能力与GPT-4旗鼓相当
科大讯飞星火认知大模型3 0正式发布。星火3 0的整体性能已经超越ChatGPT,部分能力与GPT-4旗鼓相当。科大讯飞立下又一个Flag,星火4 0要对标GPT-4
2024-12-13 22:43:43 -
高考大模型测评_豆包文科成绩领先
什么?好多大模型的文科成绩超一本线,还是最卷的河南省???没错,最近就有这么一项大模型“高考大摸底”评测走红了。河南高考文科今年的一本线是521分,根据这项评测,共计四个大模型大于或等于这个分数,其中头两名最值得关注:
2024-12-13 23:27:45 -
ChatGPT、阿里通义等AI机器人参加今年高考出分:干翻90%考生,有一科全员不及格
6月19日,上海人工智能实验室和司南评测体系发布了国内首个针对AI大模型参与2024高考「语数英」三科目的全卷解题能力测试的结果。
2024-12-13 23:42:30