三只羊卢总的AI合成录音到底能不能做?我的答案是:当然能
今天凌晨,N多人给我发了一张图,说警方通报了,问我到底怎么看三只羊录音是不是AI这事。
还有朋友跟我说,有个号称「国内AI第一人」的,之前信誓旦旦的说这录音必不可能是AI,AI做不出来。
所以这个通报背后,会不会背后是有些阴谋论?
我差点都喷了,国内AI第一人?我第一反应是院士也下场参加这种无聊的事了?
然后查了一下...哦.....算了不提了。
我觉得我有必要科普一下,就是AI到底能不能做到三只羊卢总录音级别?
我可以明确的给你一个回答,是:能。
先简单说下前情提要。
三只羊跟辛巴有一段乱七八糟的风波,反正就是互相掐架,你来我往,好不热闹。
然后风波正甚时,三只羊董事长卢文庆的一段炸裂的录音被全网疯传。
就是这个录音视频,我做了删减,其中一些不雅片段我也全部消音处理了。
内容炸裂不堪入耳,信量极大且内容十分惊人,其中涉及权斗、出轨等等等,总结一下就是卢总自爆和三只羊所有女主播有过不正当的关系。还点名看不起张一鸣。。。
大概就是这么个事,然后三只羊就举报了,说这录音是AI合成的。
网上就吵得不可开交了,大部分人最大的理解就是,AI做不出来这种级别的录音,为什么?因为那个“国内AI第一人”说的。
这段录音听着很真实对吧,有情绪有方言有杂音,所以问题其实就是两个,这段录音,到底是不是AI做的?以及,AI到底能不能做到这种级别的录音?
第一个问题,今天已经有了答案,我永远无条件相信我们的公安,他们发布的通报,我也相信就是事实,这个没有任何可以争议的。所以第一个问题的答案相当明确,那就是AI做的。
那么第二个问题,最关键的来了,AI到底能不能做到这种级别的录音。
我的答案,当然能。
首先,我需要在这里科普一下,AI是个大类,而在细分里面还有很多赛道。
有语言大模型(GPT、Claude、豆包等等),有AI绘图(MJ、SD、FLUX等等),有AI音频(11Labs、SVC、GPT-Sovtis、Suno等等)、有AI视频(Runway、可灵、豆包、Pixverse等等)、有AI 3D(TripoAI、Meshy等等)。
而AI音频里,又分为AI生成音乐、AI生成音效、声音克隆。
这个录音,属于声音克隆这个赛道里面的。
所以不要说AI能做出来这个就比OpenAI比ChatGPT还要**,都不是一个赛道的,有啥可比的,就像你说哇这个洗衣机洗衣服真**,比那个冰箱还要**。。。
而声音克隆,又分为两种:TTS(文本生成语音)、SVC(AI换声)。
TTS就是给一段一个人的人声,只要几秒几十秒的素材,就能训练一个AI模型,然后直接用文字就能生成特定人声音音频的语音合成,现在最好的开源项目应该是GPT-sovits。
SVC你就可以通俗的理解成AI换声,就是AI时代的变声器。现在AI变声器领域三个扛把子项目:So-vits-svc、RVC、DDSP。
OK,现在清楚在AI声音克隆领域,也有两种手段来实现声音伪造了吧。
TTS项目,优点是数据要求短,5秒的音频素材就行,就能克隆你的声音,后续只要给文本就能生成音频,成本极低效果极快。但是缺点就是,情绪、停顿、真实度的上限都很低,听个几十秒,就能非常轻松的听出来哦这个是AI味道。
而之前,大家觉得AI做不了卢总的音频伪造,都是先入为主的带入了TTS的思路,觉得一定是用TTS做出来的。
非常坦率的讲,TTS做卢总这种级别的音频,就我所知道的市面上公开的产品(不包括各大公司内部实验室的项目),确实有点难。
但是,思路打开,TTS做不了这个,但是SVC呢?
SVC的缺点,就是成本高,需要起步30分钟的音频数据集,然后跑几个小时的炼丹训练这个人的人声模型,最后还需要再找一个人录一段音频,再用SVC换声,把音色替换过去。
而优点就非常的直白了,这玩意能保留说话人的所有情绪、停顿、语气、方言等等等等,质量上限约等于无限,只要模型好,你根本听不出来这到底是不是AI的。
连歌声都可以无缝换声,换你个说话声音,简直就是个小case了好吧。
去年爆火的「AI孙燕姿」,就是拿SVC做的。
所以用SVC做卢总的AI音频伪造,步骤也很简单。
1. 从网上收集卢总的30分钟左右说话数据,这个很好找,毕竟他是名人。
2. 用SVC或者RVC,把卢总的声音清洗完,训练成一个AI模型。
3. 卢总是安庆人,合肥那边安庆人很多,找一个跟他口音差不多的,把需要合成的音频自己先念一遍。
4. 最后用SVC的AI模型,把念完的音频替换成他的声音。
女声同理。
至此,完毕。
如果你还想听着真实一点,就用剪映啥的加点风噪环境音,太多了,随便找,你要环境音,传统音频软件能处理,当然,你也可以拿着带环境音的数据集进去训练,虽然我不推荐这么做。。。
特别是原视频那个方式,是把录音发到手机上,再用手机播放,用另一台手机来录,本身环境音就一堆了,还夹在着哥们背景笑声,乱七八糟的。这都属于场外因素了。。。
所以,回到第二个问题,AI能不能做卢总那种的伪造录音?当然能。
不要把AI想的太神话,也别把AI想的太*,人工智能,很多时候是人工+智能。
现在的TTS,解决不了情绪问题,那为啥非要让AI去搞定情绪?
你人工念完了换音色不就行了?这就是人工+智能。
思路打开,不要太局限。
AI是你的助手,是辅助工具,是让你用的,不是让你啥都甩给他当甩手掌柜的。
最后,我想声明一下。
我写下这篇文章,不是让大家去知道这个技术,而去犯法,做一些法外之事,成为法外狂徒。
而是希望做一个关于AI音频的小小科普,抹平信息差,让大家知道有这么个技术,上限就在这,不要觉得AI做不到就可以掉以轻心。而是要知道,现在的AI,可以达到什么地步,什么水平。
在人工+智能的加持下,能做到什么事情。
科技的进步是不可逆的,所有人都是这巨大洪流中的一滴水,只会被裹挟着前行,知道永远比不知道好,知己知彼,方能百战不殆。
我们学习很多东西,学习AI,很多时候,是为了保护我们自己。
还有,保护我们的家人。
然后,更好的生活。
-
三只羊卢总的AI合成录音到底能不能做?我的答案是:当然能
N多人给我发了一张图,说警方通报了,问我到底怎么看三只羊录音是不是AI这事。我觉得我有必要科普一下,就是AI到底能不能做到三只羊卢总录音级别?
2025-01-08 16:56:08 -
消息传,OpenAI将在12月发布「猎户座」模型丨谷歌正在开发网页任务自动处理项目丨智谱清言APP上线语音对话功能
【AI奇点网2024年10月28日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-08 16:26:50 -
苹果推送iOS 18.1「苹果AI」同步到来丨谷歌将AI总结搜索拓展到100多国丨Meta正在开发AI搜索服务
【AI奇点网2024年10月29日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-08 16:03:00 -
创新不设限!2024新“智”慧全国AI数字创意大赛吸引百余组选手参赛
本次大赛于今年5月在蓉城成都盛大启幕,聚焦于安防、清洁、配送三大前沿领域,旨在汇聚全球设计师、创意团队及科技发烧友的智慧力量,以无限创意重塑未来机器人的外观设计与用户体验,为加速新质生产力的培育与发展注入新动力。
2025-01-08 15:40:53 -
小米发布「超级小爱」AI助理打通全场景生态丨苹果发布2024款Mac mini搭载AI功能丨雷军呼吁网友不要再玩AI语音克隆
【AI奇点网2024年10月30日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-08 15:17:22 -
腾讯发布AI智能工作台ima.copilot丨Runway CEO发文:AI设施公司的时代结束了丨全球首个开源AI大模型标准发布
【AI奇点网2024年10月31日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-08 14:52:43
-
怎么快速给模特换装_怎么用stable diffusion给模特换装
本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusion来辅助我们完成服装效果展示。本教程适用于电商设计场景、摄影场景等多个运用人物设计的实战中
2024-12-23 13:57:15 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
AIGC落地实践!四招帮你快速搞定运营设计
回顾这一年,随着 AIGC 浪潮的爆发,在掌握AI工具已经成为设计师必备技能。今天这篇文章,通过三个案例流程拆解带大家从新时代设计工作流,到必备「四大招式」,到图标设计六大方向,到训练专属模型,再到全流程手把手拆解设计项目,绝对干货满满
2024-12-18 16:57:17 -
ChatGPT怎么本地登录_GPT怎么使用_GPT本地项目
本期就ChatGPT的这次更新再次将完全新人使用指南提上日程,并对此次更新做些设想和想象。希望大家喜欢!
2024-12-19 07:41:20 -
stable diffusion初识_stable diffusion跟其他工具有什么区别]
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
2024-12-24 13:45:31 -
PikaAI怎么用_PIkaAI怎样生成视频_AI视频生成器Pika怎么用_AI视频生成工具Pika教程
Pika这款工具7月份在AIGC界横空出世,被圈内誉为目前“全球最好的文本生成视频AI工具”之一,也被认为是另外一款知名AI视频生成工具Runway的强有力挑战者。
2024-12-25 13:35:53 -
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
stable SR脚本安装_stable diffusion脚本网站
上节课我们讲的4xUltraSharp是不是觉得已经很强了! 那么如果我拿出Stable SR脚本你应该如何应对呢?
2024-12-31 13:49:18 -
零基础2天速成!白嫖「秋叶」官方AI绘画课程,卷死同事
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
2024-12-17 12:53:01 -
openpose如何自定义角色_个性化角色姿势怎么定制_Controlnet深度解析
在设计角色姿势时,如何使用openpose进行姿势自定义,以及如何通过拍摄照片或使用第三方后期软件?同时,虚幻引擎对于角色姿势的编辑也很重要,本视频就并展示了如何使用优异商城中的免费资源来创建人物角色。
2024-12-19 11:43:51