Stability AI发布自家最强文生图模型Stable Diffusion 3!提示文本理解更好,图像质量更强
2月23日,著名大模型开源平台stability.ai在官网推出了——Stable Diffusion 3.
该版本与Stable Diffusion 2相比,在文本语义理解、色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强,可对标闭源模型Midjourney。
Stable Diffusion 3的参数在8亿——80亿之间,也就是说Stable Diffusion 3可能是专为移动设备开发的,AI算力消耗将更低,推理速度却更快。
目前,Stable Diffusion 3支持申请使用,未来会扩大测试范围。
申请地址:https://stability.ai/stablediffusion3
stability.ai没有过多的介绍Stable Diffusion 3的技术内容,但指出其核心架构使用了Transformer和Flow FMatching(简称“FM”)。
Transformer大家都很熟悉了,ChatGPT、T5、BERT等很多著名模型都是基于该架构开发的。
而FM是Meta AI和魏茨曼科学研究所在2022年10月发布的,一种全新高效建模、训练技术概念。
Flow Matching论文地址:https://arxiv.org/abs/2210.02747
Flow Matching简单介绍
目前,很多文生图模型使用的是CNF(连续正规化流动)训练方法,主要使用常微分方程对流动进行建模,实现从一种已知分布到目标分布的平滑映射。
但由于训练过程需要进行大量的微分方程模拟,会导致算力成本高、模型设计复杂、可解释性差等缺点。
FM则是放弃微分方程的直接模拟,而是通过回归固定条件概率轨迹来实现无模拟训练。研究人员设计了条件概率分布与向量场的概念,利用边缘分布的结合可以建立总体目标概率轨迹与向量场,从而消除了模拟过程对梯度计算的影响。
1)条件概率路径构建:FM需要给出一个目标概率路径,该路径从简单分布演变到逼近数据分布。然后利用条件概率路径构建了目标路径,这样每个样本有一个对应的条件路径。
2)变换层:构成FM的基本单元,每个变换层都是可逆的。这意味着从输入到输出的每一步映射都可以精确地反转,从而允许从目标分布反推到原始分布。
3)耦合层:将输入分成两部分,对其中一部分应用变换,而变换函数可以是任意的神经网络,其参数由另一部分决定,保证了变换的可逆性。
目前,FM技术已在图像生成与超分辨率、图像理解、图像修复与填充、条件图像生成、图像风格迁移与合成、视频处理等领域得到广泛应用。
Stable Diffusion 3案例展示
本次的发布页面也是由Stable Diffusion 3生成的,提示词:史诗般的动漫艺术风格,一位巫师站在夜间的山顶上,向黑暗的天空施放咒语,上面写着由彩色能量生成的“Stable Diffusion 3”文字
教室桌子上有一个红苹果,电影风格,背景的黑板上用粉笔写着“要么做大,要么回家”
一名宇航员骑着一只穿着蓬蓬裙的猪,撑着一把粉色的伞,猪旁边的地上有一只戴着高帽的知更鸟,角落里写着" Stable Diffusion "的字样。
一只变色龙,黑色背景,摄影风格。
一辆跑车的夜间照片,侧面写有“SD3”字样,汽车在赛道上高速行驶,巨大的路标上写着“更快”的文字。
波浪冲击苏格兰灯塔的鱼眼镜头照片,黑色波浪。
-
Stability AI发布自家最强文生图模型Stable Diffusion 3!提示文本理解更好,图像质量更强
2月23日,著名大模型开源平台stability ai在官网推出了——Stable Diffusion 3 该版本与Stable Diffusion 2相比,在文本语义理解、色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强,可对标闭源模型Midjourney。
2025-02-12 12:54:57 -
Sora模型训练数据疑似泄露丨荣耀MWC发布AI时代产品战略丨首部由AI绘画创作的动画片在央视播出
【AI奇点网2024年2月26日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-12 12:31:21 -
网友惊呼:拜登模拟器!特斯拉“擎天柱”机器人2月再放最新视频:健步如飞
当地时间2月24日本周六,特斯拉官方通过推特(X)平台分享了一段最新视频。视频展示了该机器人在测试场地内行走,并配上诙谐的配文:“完成每日步数目标。”
2025-02-12 12:07:06 -
最强开源文生图模型Stable Diffusion 3发布:支持生成精准单词文字,画质大幅跃升丨含注册申请方式
知名的大模型创业公司Stability AI开发的新一代文生图大模型Stable Diffusion 3终于发布了。普通人怎样体验Stable Diffusion 3?即刻加入排队候补名单!
2025-02-12 11:39:30 -
地表最强开源AI绘画模型Stable Diffusion V3重磅登场:与Sora采用相似技术,一大波样片抢先看
新一代的本地AI绘图创作模型Stable Diffusion 3正式发布了。目前推出了Alpha预览版,将于近期开放给普通用户。AI生图效果超越自我,再次到达了新的高度!
2025-02-12 11:17:25 -
冒充Sora生成的AI视频,已经成为营销号涨粉的流量密码
年后开工第一周,全网都被Sora的热度刷屏了一周。虽然Sora还未对外开放,但互联网已经变得越来越荒诞。AI越来越像真的,真人越来越热衷假冒AI。
2025-02-12 10:51:05
-
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
思维脑图工具也能创作AI绘画作品,如何使用博思白板进行AI绘画
博思白板boardmix的创作平台提供多种登录方式,最方便要属直接微信扫码登录,然后绑定手机号实名制。再点击页面正中央紫色的按钮「免费使用」,你就可以进入博思白板boardmix的内容创作操作台。
2024-12-26 09:08:34 -
AI绘图模型测评_Meta Imagine发布_Meta Imagine最新地址
针对Meta Imagine,Midjourney,Adobe Firefly,Dalle,这四个我心目中的比较大的AI绘图模型测评。我会从细节质量、审美(构图色彩等)、风格多样化、语义理解这四个维度来评测,每个维度3个Prompt,同时每个Prompt我会在AI绘图模型中roll3次,取效果最具有代表性的那个图,尽量减少偏见。
2024-12-13 17:44:01 -
快手AI文生视频大模型【可灵】首发实测:这可能将成为真正意义的第一款「中国版Sora」
昨天,6月6号,是快手的13周年生日。在这一天,所有AI圈的人都想不到,快手在13周年之际,没有任何预兆、没有任何宣传,直接发布了他们的AI视频大模型。可灵。
2024-12-13 20:45:55 -
Stable Diffusion 3最新模型测评丨SD3模型ComfyUI流程简单搭建
由于前不久StabilityAI开放了SD3新模型的使用权,这期我们就简单聊聊这款新模型的使用方法,以及StabilityAI对于SD3模型的发布策略,和未来的发展预期!如果本期讯息对大家有所帮助,就点赞关注支持欧阳一下吧!
2024-12-13 21:10:24 -
科大讯飞星火大模型3.0实测:高能进化,给AI注入灵魂,部分能力与GPT-4旗鼓相当
科大讯飞星火认知大模型3 0正式发布。星火3 0的整体性能已经超越ChatGPT,部分能力与GPT-4旗鼓相当。科大讯飞立下又一个Flag,星火4 0要对标GPT-4
2024-12-13 22:43:43 -
高考大模型测评_豆包文科成绩领先
什么?好多大模型的文科成绩超一本线,还是最卷的河南省???没错,最近就有这么一项大模型“高考大摸底”评测走红了。河南高考文科今年的一本线是521分,根据这项评测,共计四个大模型大于或等于这个分数,其中头两名最值得关注:
2024-12-13 23:27:45 -
ChatGPT、阿里通义等AI机器人参加今年高考出分:干翻90%考生,有一科全员不及格
6月19日,上海人工智能实验室和司南评测体系发布了国内首个针对AI大模型参与2024高考「语数英」三科目的全卷解题能力测试的结果。
2024-12-13 23:42:30 -
深度解析丨ControlNet模型的工作原理与应用场景(附案例解析)
大家好,我是言川。本期文章是2024年的第一篇文章,也是2023年农历的最后一篇文章。截至这篇文章完成时,距离春节也只有最后一周的时间了,我无法单独向支持我的朋友们传达祝福之意。所以在本篇文章的开头,向大家说一些祝福之词
2024-12-18 09:12:30 -
AI绘画进阶入门ComfyUI系列教程丨第八章,只需一步极速出图,实时绘画!!
这期继续为大家分享comfyUI的相关知识LCM和Turbo的极速出图方法,希望对大家有所帮助!
2024-12-18 10:37:06