谷歌发布AI视频全能模型Lumiere_迄今为止最强大，画质逆天，水时长第一，流畅一塌糊涂

2025-02-18 来源：AI图库吧

岁末年初，“硅谷卷王”谷歌再次释出王炸新模型！这次聚焦AI视频生成赛道，要说今年不出一部AI大片我是不信的！

当地时间1月23日，谷歌发布名为Lumiere的新模型，采用了最先进的[时间↔空间]U-Net架构，可以生成高度一致性的完整视频片段。

废话不多说，直接上官方宣传片：

谷歌所谓的「U-Net架构」，简而言之就是在训练大模型的时候，在空间与时间两个维度同时采样，减少AI的“发散思考”，增强画面稳定性，能显著拉长生成视频的长度和质量。

这是谷歌AI团队历时7个月打磨的首个全能视频模型。

长期以来，AI视频生成一直存在诸多的缺陷：运动连贯性和一致性很低，卡成PPT，叠影重重等一系列问题。??

谷歌自研的UNet架构可以生成5秒的视频，比竞品Runway与Pika要多一两秒。

更为重要的是，谷歌视频模型可以生成80帧的片段!不仅画质好、质量高，而且时长更长。

我们来看一些实际案例：

虽然还存在一些瑕疵，但作为首个落地模型已经相当不错了。

谷歌Lumiere视频模型不仅本领强，而且功能更加丰富，效果拔群!

视频局部编辑

这项功能可以让剪辑师快速针对视频画面当中的物体进行替换。

比如这个穿着绿色花点裙的女子，只需选中衣服的区域，输入几个简单的提示词文字，AI系统能瞬间将她的裙子换成红白条纹长裙、金色礼服。

正在晨跑的少女，让她长满鲜花，或者进行风格迁移，将其变成木砖风、折纸风、乐高风。

你甚至可以针对更小的对象进行修改和编辑。

比如，让?猫头鹰戴上眼镜。

视频画面修复

除了修改画面的内容，甚至还可以针对损失局部画面的视频进行填充修补。

右下角的这个案例，充满想象力的AI系统画出了一块毫无破绽的慕斯蛋糕。

文本生成视频

除了视频编辑功能，谷歌Lumiere自然也支持从文本生成视频片段。

画一个在火星基地周边漫步的宇航员。

画一只戴着太阳镜被车拉着走的小狗。

画一座废弃的庙宇，在遗迹中穿行。

图像生成视频

谷歌Lumiere另外一个非常好用的功能，便是将静态图像转换为动态视频。

输入提示词「姑娘微笑和眨眼」?，戴珍珠耳环的少女从名画中走出，咧嘴笑了起来。

梵高《星空》，以令人不可思议的方式流动起来。

图像风格化迁移生成视频

除了一般的“图生视频”，谷歌Lumiere模型还能根据参考图生成特定风格的动态艺术视频。

比如，传一张夜光蘑菇图?，生成各种散发荧光的动物。

再看几个别的案例，生成的视频风格复刻得非常精准。

这对于那些技艺较浅的普通视频作者真是降维打击。

运动笔刷

看到这四个字，熟悉AI视频创作的家人们想必马上联想到Runway Gen-2模型正在内测的相似功能。

?相关阅读：

AI视频可控性里程碑：Runway Gen-2上线「多重运动笔刷」大量实战案例：一键可让五个物体以不同形式运动

AI视频可控性里程碑更新：1月18日，Runway上线了多重运动笔刷，这个功能可以单独控制最多五个笔刷选定的区域。让我们看看那些优秀应用案例。

创业板人工智能创历史新高！“159363”暴涨超5%领跑同类！算力硬件大幅反攻，光模块龙头涨超8%

相关AI教程资讯

热门工具

本周AI教程资讯

更多