国产最强文生视频模型「可灵」首发:直出2分钟超长视频,生成质量完胜OpenAI Sora丨免费体验
What,什么?
《疯狂动物城》竟然都有真人版了,而且被国产AI大模型搬进现实!
欢迎进入神奇的动物世界。名为「可灵」的新一代国产AI视频生成大模型,直接生成了一则《疯狂动物城》真人版电影的预告片。?
注意!⚠️不是何炅…
可灵大模型受到Sora的启发,采用了相似的DiT架构技术路线,结合多项自研技术创新,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。
从参数上看,可灵大模型可以支持生成长达2分钟的30FPS的超长视频,分辨率高达1080P,且支持多种比例的视频宽高比。数据上已经超越了只能生成1分钟视频的Sora。
以下是一段2分钟的创作案例合辑——
第一个提示词为,两分钟不可思议的列车行进长镜头画面:一列火车向前方行驶,窗外的风景走过了春夏秋冬四季。整个两分多钟的画面十分连贯,出现了欧式老城、红叶、樱花、田野等等丰富多彩的场景,过渡自然。对比Sora展示的长镜头样片,有过之而无不及。
第二个提示词为:「小男孩在花园里骑自行车经历秋冬春夏四季变换」。
可灵大模型是何方神圣?
它出自国内头部的短视频玩家——快手。
可灵不但在想象上天马行空,在描绘运动时又能做到符合真实的运动规律,复杂、大幅度的时空运动也能准确刻画。
比如在公路上奔跑的老虎,不仅画面连贯,随镜头角度的变化合理,老虎四肢的动作协调,而且还把奔跑过程中肚腩抖动细节也展现得淋漓尽致。
还有宇航员在月球上奔跑,动作流畅,步态和影子都充满了失重感。
除了符合物理规律的运动,可灵大模型还能模拟真实物理世界特性,这里要比OpenAI的Sora生成的视频更吻合物理规律。
倒牛奶的视频中,重力规律、液面的上升都符合现实,奶泡泡沫浮于上层也充分展现。
注意看这只试图演奏钢琴的猫猫,钢琴亮面的烤瓷便面,反射出猫爪、猫猫头和琴键,并随着本体同步变化。
都说吃东西的场景最能考验AI视频的能力。
下面的小男孩吃汉堡的视频,一口咬下去,咀嚼的嘴部细节,齿印留在面包片上,小男孩享受美食的细微表情溢于言表。
要知道,符合物理规律对于所有的视频大模型来说仍是十分困难的事,OpenAI都无法处理得当。
同样是创作吃汉堡的画面,下面由Sora生成的视频相形见绌。
再来看一个男子大口吃面条的视频。这个对于目前现阶段所有所有一切AI视频模型都是「绝杀」一般的考验。
但对于可灵大模型来说,似乎就是那么驾轻就熟。毕竟快手平台有着全网最全的吃播训练素材…?
反观外网,天天还拿着「威尔史密斯吃面」来测试视频大模型的性能。?
可灵大模型不仅能还原真实世界的物理规律和运动,对于幻想的场景也是信手拈来。
比如这只戴着眼镜的兔子,边喝咖啡,边看报纸,悠闲自得。
同时,可灵大模型对微观特写的细节刻画也很到位,比如两朵缓慢绽放的花骨朵儿,对于花瓣和花蕊的细节刻画不输专业的延时摄影。
在实用性方面,可灵大模型不仅生成的视频以假乱真,而且生成的视频比例可实现三种常见的视频宽高比。
其中的竖版9:16视频,可以说与快手的短视频生态相得益彰了,主打就是一个一步到位,简洁高效。
可灵大模型的技术原理简介
那么快手旗下的可灵大模型,都运用了哪些独特的技术打磨呢?
可灵大模型具有多项优势,包括能够生成大幅度的合理运动、模拟物理世界特性、具备强大的概念组合能力和想象力,以及支持高分辨率视频生成和自由的宽高比设置。
该模型使用了Sora同款的3D时空联合注意力机制的内容生成架构,能更好地建模视频中的复杂的时空运动,从而生成更符合客观运动规律的视频。
此外,可灵大模型多样化的样片展示,还突出呈现了现阶段AI视频内容创作领域最具商业潜力的落地方向——虚构概念组合能力和强大的场景想象力,可以将主创人员脑补的画面与丰富想象力转化为具体的可视化画面。
在快手AI团队研发过程中,可灵大模型配套了高效的大规模自动化数据解决方案,保障了模型效果的快速提升。
可灵AI视频模型,诞生于短视频头部大厂,也将能以最快速的方式探索落地。
在哪可以体验可灵大模型?
相比较Sora还需要等到年底才能上线,快手可没有在画饼!不画饼~不画饼!
可灵的文生视频模型已经在快手旗下「快影」视频剪辑工具内正式开启邀测。
除了文生视频,「快影」APP还基于可灵大模型推出了其他相关的视频创作功能,比如“AI舞王”就是目前最具人气的创作工具,与此前阿里通义APP提供的“全民舞王”差不多的玩法,可通过一张图像生成“科目三舞蹈”。
其他功能方面,基于快手的文生图模型,AI简笔画、AI文生图、AI动漫等等AI创作功能,都已在「快影」APP中上线。
现在,快手的首个文生视频大模型华丽登场,作为国内乃至世界范围内的头部短视频赛道巨头,在国内从来不缺数据与创意人才,在AI场景应用能力展示上,快手理应有所宏大的建树。
如何申请可灵大模型内测?
应用商店搜索下载「快影」短视频剪辑APP,可灵大模型已经集成在其中。在APP首页可以找到「AI创作」菜单入口,再点击“AI生视频”申请体验即可。
如果没有找到该入口的话,你可以彻底退出「快影」APP,清理程序后台,重新进入APP即可。
可灵大模型项目主页:http://kling.kuaishou.com/
-
国产最强文生视频模型「可灵」首发:直出2分钟超长视频,生成质量完胜OpenAI Sora丨免费体验
新一代国产AI视频生成大模型,国内短视频龙头快手出品的AI视频生成大模型「可灵」,迄今为止最接近OpenAI Sora等世界顶级模型的新产品。
2025-01-20 16:57:01 -
微软推出首个AI天气预报系统Aurora,比传统的数值天气预报模型快5000倍
微软公司,当地时间本周一发布了首个用于天气预测的大型大气基础模型 Aurora(极光),可实现天气和大气变化的高精度预报。
2025-01-20 16:36:49 -
Stability AI发布开源AI音频生成大模型Stable Audio Open:支持一句话生成鼓点、乐器等音效,需授权商用
Stable Audio Open 是一个开源的文本转音频模型,可生成长达47秒的样本和音效。用户可以创建鼓点、乐器重复乐段、环境声音、拟音和制作元素。
2025-01-20 16:08:34 -
网页产品设计工具Figma集成GPT-4o能力,支持一键全自动生成网页前端设计
全球知名设计工具 Figma 正在经历前所未有的革新,其最新版本 GPT-4o 已经实现了自动化生成设计的功能。
2025-01-20 15:39:42 -
2024年高考启动!「人工智能」题材首次进入高考语文作文题
今年 2024 高考正式拉开帷幕,2024 高考语文科目各地高考语文作文试题已经公布,其中,「人工智能」题材首次进入作文题。
2025-01-20 15:18:56 -
库克的“终极高考”,苹果操作系统史上最大更新:12项iOS 18功能超前看
苹果公司将在北京时间6月11日凌晨1点举行WWDC开发者大会的现场直播。今年将发布的iOS 18,将是苹果操作系统开启「AI改造」的第一场高考。
2025-01-20 14:50:26
-
怎么快速给模特换装_怎么用stable diffusion给模特换装
本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusion来辅助我们完成服装效果展示。本教程适用于电商设计场景、摄影场景等多个运用人物设计的实战中
2024-12-23 13:57:15 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
AIGC落地实践!四招帮你快速搞定运营设计
回顾这一年,随着 AIGC 浪潮的爆发,在掌握AI工具已经成为设计师必备技能。今天这篇文章,通过三个案例流程拆解带大家从新时代设计工作流,到必备「四大招式」,到图标设计六大方向,到训练专属模型,再到全流程手把手拆解设计项目,绝对干货满满
2024-12-18 16:57:17 -
stable diffusion初识_stable diffusion跟其他工具有什么区别]
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
2024-12-24 13:45:31 -
PikaAI怎么用_PIkaAI怎样生成视频_AI视频生成器Pika怎么用_AI视频生成工具Pika教程
Pika这款工具7月份在AIGC界横空出世,被圈内誉为目前“全球最好的文本生成视频AI工具”之一,也被认为是另外一款知名AI视频生成工具Runway的强有力挑战者。
2024-12-25 13:35:53 -
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
stable SR脚本安装_stable diffusion脚本网站
上节课我们讲的4xUltraSharp是不是觉得已经很强了! 那么如果我拿出Stable SR脚本你应该如何应对呢?
2024-12-31 13:49:18 -
怎么设置关键词权重_怎么设置Multi Prompts
AI 绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容(AIGC)的一个应用场景。其主要原理简单来说就是收集大量已有作品数据,通过算法对它们进行解析,最后再生成新作品,Midjourney是一个由同名研究实验室开发的人工智能程序。
2025-01-03 10:00:57 -
零基础2天速成!白嫖「秋叶」官方AI绘画课程,卷死同事
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
2024-12-17 12:53:01 -
openpose如何自定义角色_个性化角色姿势怎么定制_Controlnet深度解析
在设计角色姿势时,如何使用openpose进行姿势自定义,以及如何通过拍摄照片或使用第三方后期软件?同时,虚幻引擎对于角色姿势的编辑也很重要,本视频就并展示了如何使用优异商城中的免费资源来创建人物角色。
2024-12-19 11:43:51