「ControlNet」作者发布全新微调模型插件IC-Light:轻松一键换背景,AI实现摄影棚级打光
ControlNet作者新作,玩儿得人直呼过瘾,刚开源就揽星1.2k。
用于操纵图像照明效果的IC-Light,全称lmposing Consistent Light。
玩法很简单:
上传任意一张图,系统会自动分离人物等主体,选择光源位置,填上提示词,就能毫无破绽的融入新环境了!
赶紧来个王家卫式的打光:
不喜欢?
没关系,换成窗外打进来的自然光,也就分分钟的事。
目前,IC-Light提供两类模型:文本条件重照明模型,还有背景条件模型。
两种模型都需要以前景图像作为输入。
鉴于之前Controlnet太好玩儿,这次IC-Light一出现就颇受关注,还有网友迅速做出了ComfyUI插件。
(疑惑,大家这么拼,都不睡觉的吗??)
不管是期待值还是用后体验,网友给得都很高:
Nice!迫不及待要上手玩了嘻嘻嘻嘻
。
谁能帮我把这图换个背景?
从远古MCN到贴吧再到现在小红书,各个时代,都不乏“谁能帮我换张背景”这种求助贴。
但热心网友的帮助,往往是这样子的:
就离谱。
不过说实在话,这种需求不仅存在于你我普通人之间,电商做商品海报,也常常有类似的需求。
有了IC-Light,好像一切都变得简单起来。
上传主体原图+选择光源位置+提示词,完事儿。
来看效果——
这样一张佛像原图,加上提示词“佛像、细致的脸部、科幻RGB发光、赛博朋克”,再选择“光从左侧打来”。
就能得到一张崭新的成品:
哪怕是日常场景也是适用的。
最后出的效果肉眼看还是比较自然:
根据网友分享的测评,动漫场景也适用……
背后技术
如前所说,IC-Light现在提供两类模型,两种模型都需要以前景图像作为输入。
一类是文本条件重照明模型。
简单来说就是用户可以通过输入提示词来搞定生成。
比如输入“左侧光线”“月光”等,模型会通过这些提示词和初始潜变量,来生成符合要求和特征的图像。
另一类是背景条件模型。
这种就更简单了,不需要复杂的提示词,模型结合背景提示信息,对前景的物体进行不同风格的光照变化。
而其背后的技术原理,是通过潜在空间的一致性,确保模型输出在不同光源组合下具有一致性,从而可以稳定地合成各种光照效果。
具体如下——
在HDR空间中,所有照明的光线传输都彼此独立,不同光源的外观混合效果与多光源直接作用下的外观在数学上(也就是理想状态下)是一致的。
以上面这张图的灯光阶段为例,来自“外观混合”和“光源混合”的两个图像是一致的,(理想情况下,在HDR空间中数学上等效)。
因此,在训练重新照明模型时,研究人员在潜在空间中使用多层感知机(MLP)让不同光源的组合和传输具有一致性,并用来指导生成效果。
最终产生高度一致的重新光照效果。
由于模型使用了潜在扩散技术,因此可以在潜在空间内实现学习和重光照操作,从而在各种光照条件下产生高度一致的效果。
这些结果非常一致——尽管在训练时,模型没有直接使用法线图数据,但可以将不同的重新光照合并为法线贴图。
看下面这张图,从左到右依次是输入、模型输出、重新照明、分割的阴影图像和合并的法线贴图。
感兴趣的小伙伴可以前往下面地址试玩儿哟~
GitHub直通车:
https://github.com/lllyasviel/IC-Light?tab=readme-ov-file
-
「ControlNet」作者发布全新微调模型插件IC-Light:轻松一键换背景,AI实现摄影棚级打光
ControlNet作者新作,玩儿得人直呼过瘾,刚开源就揽星1 2k。用于操纵图像照明效果的IC-Light,全称lmposing Consistent Light。玩法很简单:上传任意一张图,系统会自动分离人物等主体,选择光源位置,填上提示词,就能毫无破绽的融入新环境了!
2025-01-28 15:54:34 -
苹果启动AI云计算数据中心建设计划:自研服务器芯片,将直接采用旗下M2 Ultra
未来 AI 算力领域可能发展——其他科技公司:抢购英伟达 H100、B200 芯片,而苹果直接将它的 PC 端芯片 M2 Ultra 放上了云服务器。
2025-01-27 14:52:02 -
纽约时报:苹果基于生成式AI重塑Siri,升级版语音助手将亮相WWDC 2024开发者大会
苹果公司预计将在6月举行的开发者大会WWDC上展示其人工智能领域的最新进展,届时该公司将会抽出时间,重点介绍改进后的 Siri 语音助手。
2025-01-27 14:27:44 -
外媒曝:苹果接近与OpenAI达成协议,将ChatGPT整合到iOS 18系统,彻底改造Siri语音助手
援引知情人士的消息,苹果即将与 OpenAI 达成合作协议,将 ChatGPT 整合到 iOS 18 操作系统。
2025-01-27 13:59:27 -
OpenAI重磅升级定档5月13日,CEO奥特曼暗示会有「魔法」效应,但GPT-5至少要等到年底
OpenAI终于要放大招了!官宣定档下周一线上直播,预计发布全新AI语音助手,还有ChatGPT、GPT-4一系列更新。奥特曼澄清,没有GPT-5,也没有搜索引擎!
2025-01-27 13:30:46 -
AI搜索引擎彻底鸽了!OpenAI出奇招抓“内鬼”:奥特曼宣布新品发布会主角为GPT-4大模型升级
当地时间5月10日,奥特曼最新官宣:5月13日开发布会,不是GPT-5,也不是盛传的GPT搜索引擎,改成对ChatGPT应用和GPT-4的升级。
2025-01-27 13:06:24
-
AI绘画comfyUI教程_图生图工作流程
本期的视频教程是关于在ComfyUI中搭建完整的图生图工作流的。视频中介绍了如何使用ComfyUI中的组件来实现图像的裁剪和重绘。
2024-12-18 13:42:28 -
商汤AI视频生成器如影使用方法_如影使用教程_AI视频生成测评
国内知名人工智能软件公司商汤科技近日宣布,“商汤如影SenseAvatar”数字人视频生成平台正式上线,产品愿景是“让每个人都可以轻松制作视频”,非常的直抒胸臆呀。
2024-12-17 03:24:28 -
怎么快速给模特换装_怎么用stable diffusion给模特换装
本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusion来辅助我们完成服装效果展示。本教程适用于电商设计场景、摄影场景等多个运用人物设计的实战中
2024-12-23 13:57:15 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
AIGC落地实践!四招帮你快速搞定运营设计
回顾这一年,随着 AIGC 浪潮的爆发,在掌握AI工具已经成为设计师必备技能。今天这篇文章,通过三个案例流程拆解带大家从新时代设计工作流,到必备「四大招式」,到图标设计六大方向,到训练专属模型,再到全流程手把手拆解设计项目,绝对干货满满
2024-12-18 16:57:17 -
stable diffusion初识_stable diffusion跟其他工具有什么区别]
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
2024-12-24 13:45:31 -
PikaAI怎么用_PIkaAI怎样生成视频_AI视频生成器Pika怎么用_AI视频生成工具Pika教程
Pika这款工具7月份在AIGC界横空出世,被圈内誉为目前“全球最好的文本生成视频AI工具”之一,也被认为是另外一款知名AI视频生成工具Runway的强有力挑战者。
2024-12-25 13:35:53 -
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
stable SR脚本安装_stable diffusion脚本网站
上节课我们讲的4xUltraSharp是不是觉得已经很强了! 那么如果我拿出Stable SR脚本你应该如何应对呢?
2024-12-31 13:49:18 -
怎么设置关键词权重_怎么设置Multi Prompts
AI 绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容(AIGC)的一个应用场景。其主要原理简单来说就是收集大量已有作品数据,通过算法对它们进行解析,最后再生成新作品,Midjourney是一个由同名研究实验室开发的人工智能程序。
2025-01-03 10:00:57