中国公司又把:数字人开源了,1张照片即可生成高清视频
作为当下AI行业为数不多能够找到PMF(产品市场匹配)的领域,数字人已经让很多企业赚到大钱。例如专注海外市场的中国数字人企业HeyGen,在去年年中就宣布实现ARR(年度经常性收入)3500万美元。因此,市面上好用的数字人产品基本都是付费,开源产品效果相对不佳。但是HeyGem作为一个非常轻量化的开源免费产品,从演示视频来看效果非常不错,其官方简介也将自己称为HeyGen平替。此次开源的HeyGem.AI模型,通过“1秒视频或1张照片”的输入,可以实现30秒克隆形象与声音、60秒生成4K超清视频,并在复杂场景下仍能保持100%口型匹配及多表情动作输出,性能达全球TOP级水平。技术层面,该模型的推理速度达1:0.5,32帧/秒超高清4K输出,超越电影级标准。同时,模型支持Docker一键部署,最低Nvidia 1080Ti显卡即可运行。可一键安装于Windows和Linux系统,在本地实现完整的数字人克隆和视频合成,无需额外的算力投入。值得注意的是,此次硅基智能在GitHub开源硅基数字人克隆模型的同时,特别提供了硅基数字人克隆同名软件安装包,使得即便是缺乏编程经验的用户,也能在本地环境中一键安装并直接使用,实现了零代码门槛。正是由于这种高质量、低门槛的表现,HeyGem.ai被视为首个开源免费的商用级别克隆数字人模型。对于规模巨大的电商行业来说,这无疑是一个新的营销利器。那么HeyGem.ai开源且好用的原因何在?值得注意的是,硅基智能在底层技术路线上与其它产品有所区别。硅基智能成立于2017年8月,总部位于中国南京,早在生成式AI技术火爆之前就已经布局数字人技术,其底层模型专为数字人打造,并非sora这类通用视频生成模型,在成本端拥有天然优势。而硅基智能方面也向观察者网透露,既然选择开源,就代表了技术上的自信,意味着公司将来还能够不断拿出更好的产品。硅基智能创始人司马华鹏表示,硅基智能成立之初就确立了为世界造出1亿硅基生命的使命,这次开源就是为了加速这个使命的达成。事实上,HeyGem.ai并非凭空出现,早在2024年5月硅基智能就已率先开源了全球首个2D真人级别、支持AIGC实时渲染的数字人模型代码——duix.ai。在GitHub上线以来,已获得超过4.5k Stars。同年8月,硅基智能推出高保真、实时Face swap算法ReHiFace-S,只需一张照片,无需任何数据训练,一键即可将视频中的脸部替换为你选择的人物形象。在实际应用中,硅基数字人克隆能够通过语音或文字输入驱动,克隆后的数字人音色支持英、日、韩、中、法、德、阿拉伯和西班牙语这8种语言输出,为跨国企业、在线教育、影视制作、直播营销等多场景提供了高效、低成本的解决方案。但在技术之外,面对由字节跳动等大公司推出的即梦、剪映等产品的竞争,对于硅基智能这类垂直企业,以开源方式尽快抢占市场并搭建开发者生态,或许也是商业层面必须要做出的选择。 -
中国公司又把:数字人开源了,1张照片即可生成高清视频
AI开源的风,又刮到了数字人领域。 3月9日,硅基智能旗下数字人模型HeyGem ai宣布开源,截至目前,该模型在GitHub上已获得超过1 3k Stars。 作为当下AI行业为数不多能够找到PMF(产品市场匹配)的领域,数字人
2025-04-16 11:41:48 -
Stable Diffusion在安卓手机本地生成,喝杯水的功夫就出图了你敢信?
移动芯片巨头高通公开一段演示视频,搭载骁龙芯片的手机可以直接运行参数规模超过10亿的Stable Diffusion,且只需要15秒左右就可以出图,证明了生成式AI已经落地到手机应用,混合AI时代已至!
2025-04-16 11:35:17 -
AI数字人“镇长”亮相佛山南海里水
佛山消息,佛山市南海区里水镇2025年百亿项目推动高质量发展攻坚活动举行,里水镇镇长余海生以AI数字人的方式出场,发布了《里水镇2025年高质量发展重点项目》。 当前,南海正在打造人文经济引领区,提出将“人文
2025-04-16 11:16:52 -
李开复 AI 2.0 新公司零一万物亮相丨文心一言上架 App Store丨AI医生与真人医生一起义诊
【AI奇点网2023年7月4日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-16 11:05:39 -
全国两会期间,数字人技术成为代表委员热议焦点
近期数字人领域迎来多重技术突破与政策支持。全国两会期间,数字人技术成为代表委员热议焦点,有代表将高度逼真、具备智能交互能力的专属数字人助手应用于政策解读与信息传播工作。该数字人通过对接大模型实现多
2025-04-16 10:50:55 -
教你用ChatGPT处理Excel复杂问题,效率狂升!
人工智能技术的快速发展正在改变着我们的生活方式。在办公场景中,人工智能技术也被广泛应用。越来越多的AI办公软件涌现出来,为我们提供了更加高效便捷的工作方式。从智能办公到自动化流程,这些AI办公软件正在以惊人的速度改变着我们的办公方式。
2025-04-16 10:45:14
-
Music To Image音生图工具是什么_AI音频生成图像工具有哪些_AI音生图工具有哪些_Music To Image怎么用
「Music To Image」是一款AI音频生成图片的多模态转换工具,它的本质生成逻辑是音频→文本提示词→图像。
2024-12-17 00:06:33 -
挑战用AI做一个全网最复杂的红包封面(挂件+动态)丨附使用教程
春节马上就要到了,一年一度的微信红包封面大战又要开始了。微信公众号奖了我一万多个红包封面。所以这次我打算调整一下做个最复杂的红包封面,也就是挂件+动态,并且借由这个测试下现在AIGC的能力边界。
2024-12-18 10:08:19 -
钉钉发布V7.5版本:首次推出AI个人助理产品「超级助理」,人人都可以创建专属的AI助理并上架应用市场
钉钉举行V7 5版本的迭代产品发布会,钉钉正式发布了基于70万家企业需求共创的AI助理产品,推动AI的使用门槛进一步降低,让人人都能创造AI助理。
2025-02-19 14:21:28 -
跟人类学孬了!联合国:AI大模型的回复存在严重的性别偏见、种族偏见与刻板印象等问题
报告指出,女性在大模型的描述中,从事“家务劳动”的频率是男性的4倍,而男性名字则与“商业”、“管理层”、“薪水”和“职业”等词汇联系在一起。
2025-02-08 12:52:22 -
?新年新气象!小红书推出AI人物头像绘图模型「InstantID」:轻松打造龙年新春头像,一键免费焕新
近日,小红书团队推出了一款AI头像生成工具「InstantID」,直接刷屏了。使用门槛较低。只需要用户提供一张自拍照就可以轻松生成一大波风格迥异的照片。
2025-02-13 14:27:20 -
AI概念股表现强势 Arm Holdings(ARM.US)涨超14%
周三,AI概念股表现强势,Arm Holdings(ARM US)涨超14%,甲骨文(ORCL US)、戴尔科技(DELL US)涨超7%,C3 ai(AI US)涨超6%。消息面上,美东时间周二,在当晚的白宫活动中,特朗普宣布,OpenAI、软银和甲骨文将成立
2025-02-25 17:23:06 -
微博推出“明星AI情感伴聊”:模拟你喜欢的爱豆来陪你聊天,演员李兰迪已进驻
用户向明星发送私信,专属的AI助手将模拟明星的聊天方式和风格进行自动回复,以情感陪伴提升用户体验。微博将陆续邀请更多明星开启该功能。
2025-04-04 10:51:09 -
AI绘画ComfyUI进阶教学丨Mask遮罩基础运用,IPA+CN+Lora+prompts+遮罩
本期开始正式进入遮罩相关的高级应用,这里我们会尝试为不同组件应用不同区域的遮罩,实现构图、效果的不同区域实现。希望本期内容能对大家有所帮助和启发,最后如果喜欢欧阳的教程就千万不要忘记支持一波啦!!!
2024-12-17 09:48:56 -
Suno ai全面使用指南丨AI音乐GPT时刻来临,人人都能成为音乐大师!
最近,AI 音乐的 ChatGPT 时刻来临啦!一款音乐 AI神器——Suno V3发布,引发了广泛关注。这款AI音乐工具凭借其独特的创新,持续占据各大平台热搜榜首。
2024-12-17 20:54:47 -
2D转3D成熟倒计时!2023(最全)AIGC-3D技术总结,一个视频搞懂AI生成3D模型
2023年我们见证了AI生成图像的快速进化,同样在这一年,AI生成3D虽然相对之下默默无闻,但也出现了很多重要的技术,实现了从0到1的突破。相信2024年一定会迎来AI生成3D技术的突飞猛进。这个视频我们一起看一下2023年AI生成3D有哪些重要工作,提前了解。为后面的成熟做好准备。
2024-12-18 14:25:53











