韩国团队打造IDM-VTON扩散模型:实现AI一键试衣,让奥特曼、黄仁勋等大佬换穿淘宝文化衫
以下文章来自于丨机器之心
AI 帮你来试衣,想穿什么款式一键搞定。
精准捕捉服装细节,衣服纹理、图案、缝线等属性高度还原:
即使是在户外,AI 试衣也能准确展示试穿效果,保持较高质量的输出:
人物坐立姿势对衣物有遮挡,AI 也会毫无破绽的实现一键换衣,高度保持服装细节的一致性:
既然 demo 演示这么厉害,那试试让黄仁勋、奥特曼、霉霉等名人穿上机器之心的文化衫,出来的效果会怎么样呢?
换装①:
换装②:
换装③:
试用了几轮下来,换装效果的确不错,但也有一些瑕疵,比如换装后有时会出现大花臂、衣服上的字体没有很好地还原、手部变形。
上面展示的虚拟试衣技术由韩国科学技术院(KAIST) 、OMNIOUS.AI 共同打造,他们提出了一种名为「IDM-VTON」的新型扩散模型,该技术在提高服装保真度的同时,还能生成真实的视觉效果。
IDM-VTON 整体 pipelne 如下图左所示:IDM-VTON 包括(1)TryonNet 用于处理人物图像;(2)图像提示适配器(IP-Adapter)用于编码服装图像的高级语义;(3)GarmentNet 用于编码低级特征。
在 UNet 输入中,本文将人物图像潜在的噪声潜在与分割掩码、掩码图像和 DensePose 进行了拼接。本文还提供了服装的详细说明(例如,[V]:短袖圆领 T 恤),然后这些说明作为 GarmentNet 和 TryonNet 的输入提示。
注意力模块细节如下图右所示:
TryonNet 和 GarmentNet 的中间特征被连接起来并传递到自注意力层,并使用输出的前半部分(即来自 TryonNet 的部分)。然后通过交叉注意力层将输出与来自文本编码器和 IP-Adapter 的特征融合。此外,本文还对 TryonNet 和 IP-Adapter 模块进行微调,同时冻结其他组件。
最后,我们再展示一下 IDM-VTON 的其他效果。
多人试穿同一件衣服:结果显示 IDM-VTON 可以生成高保真图像,识别服装细节。
IDM-VTON 和其他方法的比较结果可以看出,IDM-VTON 能够生成真实的图像并能够保留服装的细粒度细节。
了解更多内容,请参考原论文。
论文地址:https://arxiv.org/pdf/2403.05139.pdf
论文主页:https://idm-vton.github.io/
论文标题:Improving Diffusion Models for Authentic Virtual Try-on in the Wild
想体验这款最新的AI大模型可以访问Hugging Face网站:
https://huggingface.co/spaces/yisol/IDM-VTON
-
韩国团队打造IDM-VTON扩散模型:实现AI一键试衣,让奥特曼、黄仁勋等大佬换穿淘宝文化衫
在未来世界,一键换装,AI 帮你轻松试穿各种服饰,想穿什么款式只需一键搞定。支持精准捕捉服装的细节,还原衣服的纹理、图案、缝线等细节属性。
2025-01-29 19:40:25 -
苹果高管:Mac是可以买到最好的AI电脑丨奥特曼:AI可能是最伟大的技术变革丨黄仁勋:AI不会完全取代人类工作
【AI奇点网2024年4月29日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-29 19:15:34 -
清华系重磅出手!国内首个「Sora级」AI视频大模型横空出世,全面对标Sora,可生成6秒时长视频
2024中关村论坛上,生数科技首席科学家朱军宣布,生数科技与清华大学联合推出中国首个原创全自研长时长、高一致性、高动态性的视频大模型Vidu。
2025-01-29 18:48:43 -
生数科技清华团队出手非凡:最强国产类Sora视频模型「Vidu」发布,效果一鸣惊人!
生数科技CEO唐家渝透露:“年内目标要达到跟Sora一样的效果。”现如今,首个「Vidu」模型版本亮相,在一致性与时长方面都给人非常眼前一亮的印象。
2025-01-29 18:28:22 -
OpenAI CEO奥特曼在斯坦福大学演讲:不要浪费时间解决GPT-4的局限性,GPT-5会让一切努力白费
斯坦福大学辍学出道的 OpenAI CEO 奥特曼,近日受到了大量在校生的追捧和欢迎,奥特曼向大学生与大学创业者们分享了他对 AI 未来发展的洞见
2025-01-29 18:06:01 -
英国最新调查显示:因为AI技术突破,1/3的翻译人员和1/4的插画师丢掉了工作
英国作家协会对12500名协会的成员进行了一项关于生成式AI技术发展的影响调查,1 4的插画师和超过1 3的翻译人员(36%)因生成式AI引入而失去了工作。
2025-01-29 17:37:35
-
AI绘画comfyUI教程_图生图工作流程
本期的视频教程是关于在ComfyUI中搭建完整的图生图工作流的。视频中介绍了如何使用ComfyUI中的组件来实现图像的裁剪和重绘。
2024-12-18 13:42:28 -
商汤AI视频生成器如影使用方法_如影使用教程_AI视频生成测评
国内知名人工智能软件公司商汤科技近日宣布,“商汤如影SenseAvatar”数字人视频生成平台正式上线,产品愿景是“让每个人都可以轻松制作视频”,非常的直抒胸臆呀。
2024-12-17 03:24:28 -
怎么快速给模特换装_怎么用stable diffusion给模特换装
本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusion来辅助我们完成服装效果展示。本教程适用于电商设计场景、摄影场景等多个运用人物设计的实战中
2024-12-23 13:57:15 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
AIGC落地实践!四招帮你快速搞定运营设计
回顾这一年,随着 AIGC 浪潮的爆发,在掌握AI工具已经成为设计师必备技能。今天这篇文章,通过三个案例流程拆解带大家从新时代设计工作流,到必备「四大招式」,到图标设计六大方向,到训练专属模型,再到全流程手把手拆解设计项目,绝对干货满满
2024-12-18 16:57:17 -
stable diffusion初识_stable diffusion跟其他工具有什么区别]
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
2024-12-24 13:45:31 -
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
stable SR脚本安装_stable diffusion脚本网站
上节课我们讲的4xUltraSharp是不是觉得已经很强了! 那么如果我拿出Stable SR脚本你应该如何应对呢?
2024-12-31 13:49:18 -
怎么设置关键词权重_怎么设置Multi Prompts
AI 绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容(AIGC)的一个应用场景。其主要原理简单来说就是收集大量已有作品数据,通过算法对它们进行解析,最后再生成新作品,Midjourney是一个由同名研究实验室开发的人工智能程序。
2025-01-03 10:00:57 -
零基础2天速成!白嫖「秋叶」官方AI绘画课程,卷死同事
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
2024-12-17 12:53:01