文本生成超逼真语音,ElevenLabs获8000万美元融资
1月23日,文本生成语音平台ElevenLabs在官网宣布,获得8000万美元(约5.7亿元)B轮融资。本次由Andreessen
Horowitz、Nat Friedman领投,红杉资本、 SV Angel等跟投。
用户通过文本和语音的方式在ElevenLabs平台,就能生成中文、英文、日文、韩文等29种语言以及1000多种声音,同时可以对生成语音的清晰度、风格、稳定等参数进行自定义设置。
此外,ElevenLabs在宣布融资的同时发布了新的配音工作室、语音库和移动应用三款预览产品,以巩固其在生成式AI语音领域的独角兽地位。
资料显示,ElevenLabs创立于2022年4月,总部位于美国纽约,最初员工不超过10人,目前已增长至40多人。
ElevenLabs曾在2023年1月获得200万美元种子轮融资,6月21日获得1900万美元A轮融资。
ElevenLabs于2023年1月正式推出了测试产品,因简单、易用、免费等优势,其注册用户很快突破100万,目前41%的财富 500 强公司在使用其产品。
包括世界上最大的有声读物出版商之一的Storytel;全球著名内容创作者平台TheSoul Publishing;
知名游戏开发商Paradox Interactive等。这些企业通过ElevenLabs平台制作有声读物、电影配音、游戏NPC的声音等。
Eleven Labs核心团队
产品方面,ElevenLabs基于自研的Eleven Multilingual v2、Turbo v2等大模型,提供文本生成语音、语音生成语音、语音克隆、语音识别等特色功能。
文本生成语音:用户通过文本可直接生成中文、英文、韩文、日文等29种语言语音,同时支持跨文本语音生成。例如,上传了一段英语文本,可直接生成意大利语音。
使用方法也非常简单,先选择语音生成的类型,然后选择应用的模型、语音参数和模仿语音,再输入文本,通常几秒钟就能生成语音。
虽然ElevenLabs支持中文语音,但根据「AIGC开放社区」的实际体验,其语音、语调等方面还是有很强的机器人感觉,英语和其他语种表现却很好。
语音转语音:可帮助用户将语音自动转换成别的语音,例如,上传了一段男声语音,可以自动转换成老年人的声音。
传统的语音转换方法是,需要采集音频样本,然后提取基频、共振峰、时域和频域特征等,再进行去噪、归一化,整个流程非常繁琐复杂。
而ElevenLabs可实现一键语音转换,同时支持用户对语音进行可视化控制,例如,修改强度、音峰、情感等参数。
语音克隆:用户提供一段语音片段,将其上传到ElevenLabs平台。就能通过新上传的语音,创建全新的内容,整体模仿效果非常出色。
为了减少ElevenLabs平台生成一些非法语音,例如,模仿他人亲戚用于电信诈骗,ElevenLabs推出了语音识别分类功能,用户只需要上传语音便能快速识别出是真人发音或AI自动生成的,这对于提升产品的安全性非常重要。
此外,为了进一步提升语音方面的功能,ElevenLabs在今天宣布推出了新的配音工作室、语音库和移动应用三款全新的预览产品。
新的配音工作室:可帮助用户为整部电影配音,并生成和编辑其转录、翻译和时间码,从而为内容制作提供更多控制。该功能主要面向长视频和影业的用户。
语音库:用户可以将自建的语音模板在语音库进行分享,当有其他用户使用时可以获得报酬。这个功能与OpenAI的自定义ChatGPT商店类似,都是鼓励开发者共同创建产品生态。
移动应用:可以让用户通过移动应用中,使用ElevenLabs的产品功能。前三个月将免费为用户提供服务,目前处于申请预览版状态。
ElevenLabs首席技术官 Piotr Dąbkowski表示,通过此次 B 轮融资,ElevenLabs将巩固其在生成式AI语音领域的领导者地位。
这笔资金将用于产品研究、扩大基础设施、为特定垂直领域开发新产品,以及加强安全措施,确保以负责任和合乎道德的方式开发生成式AI技术。
-
文本生成超逼真语音,ElevenLabs获8000万美元融资
1月23日,文本生成语音平台ElevenLabs在官网宣布,获得8000万美元(约5 7亿元)B轮融资。本次由Andreessen Horowitz、 Nat Friedman领投,红杉资本、 SV Angel等跟投。
2025-02-17 12:48:58 -
科大讯飞官宣星火大模型V3.5版本1月30日发布:基于国产算力底座训练,还将发布语音模型与开源模型
科大讯飞正式对外发布预热,定于 1 月 30 日 14:00 举行大模型新品发布会,发布星火认知大模型 V3 5 版本。
2025-02-17 12:25:28 -
类似OpenAI的GPTs服务:微软Copilot智能助理上线Copilot GPTs应用,可自定义创建AI机器人
微软正在邀请内测「微软Copilot版本」的GPTs自定义人工智能助理机器人服务。目前仅邀请了部分Copilot用户进行测试。
2025-02-17 12:02:38 -
OpenAI CEO奥特曼自曝GPT-5大量细节,还表示反对将AI用于人类「生死攸关」的项目
近期,OpenAI CEO奥特曼开始在各种公开场合频繁为新模型造势,不断挑动科技圈的神经。他透露,OpenAI目前的工作重心在训练GPT-5?
2025-02-17 11:38:02 -
谷歌Chrome浏览器新增三项重磅生成式AI功能:支持自动生成文本、创建AI绘制壁纸等
1月24日,谷歌在官网宣布,在谷歌浏览器(Chrome最新版本M121)中新增自动生成文本、壁纸以及自动管理标签3个全新生成式AI功能,
2025-02-17 11:10:19 -
三星澄清:暂不考虑对Galaxy AI进行收费丨“书生·浦语”数学大模型开源丨在绝大多数工作任务中,人类比AI更具性价比
【AI奇点网2024年1月24日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-17 10:41:21
-
阿里“通义听悟”升级:支持6小时超长视频内容解析提问,还可一键生成巨幅思维导图
阿里通义大模型应用产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。
2025-02-06 16:53:33 -
腾讯发布混元大模型原生AI应用「腾讯元宝」,已接入微信搜一搜,覆盖公众号内容生态
腾讯宣布旗下的主力大模型混元大模型全面升级,基于混元大模型打造了首个面向消费用户的APP「腾讯元宝」正式上线。
2025-01-21 14:37:34 -
AIGC基础应用教程丨探索AI在图像放大中的工具使用
当给到的图像素材尺寸太小或者不清晰的时候,有哪些好的AI图像放大的工具可以使用?本期就给大家推荐一些好用的工具
2025-02-06 14:24:28 -
国内大模型创企“月之暗面”发布Kimi模型重磅升级:扩容200万字上下文窗口,新增「继续」延长回复按钮
国内人工智能大模型创业公司“月之暗面”终于有了一次面向媒体的公开活动。发布了更长上下文窗口的版本:200万字上下文版本,即日起可在Kimi Chat上开启内测。
2025-02-06 17:17:20 -
小米公司开启小爱AI大模型多模态能力内测:支持图片内容问答、AI扩图、消除路人,适配小米14、Redmi K70等
3月15日,小米官方宣布小米社区开启新一轮的小爱AI大模型内测。现已开启“小爱同学多模态功能内测”。
2025-02-07 13:53:52 -
硅谷版“罗密欧与朱丽叶”:马斯克vs奥特曼的爱恨情仇丨从兄弟同心到对薄公堂,8年发生了什么?
硅谷版“罗密欧与朱丽叶”故事正在上演,马斯克是奥特曼的引路人,但让OpenAI获得今天的成功,奥特曼成为科技圈的新晋网红,决定性因素在于微软的入局。
2025-02-08 13:18:00 -
GPT-4上线一周年纪念日,OpenAI投资的机器人闪亮登场,这是我们目前能看到最接近终结者的样子
一家OpenAI投资的机器人初创公司Figure AI发布一段人形机器人的演示视频,一台基于GPT-4大模型开发,被命名为「Figure 01」的机器人横空出世。
2025-02-08 15:55:02 -
快手AI文生视频大模型【可灵】首发实测:这可能将成为真正意义的第一款「中国版Sora」
昨天,6月6号,是快手的13周年生日。在这一天,所有AI圈的人都想不到,快手在13周年之际,没有任何预兆、没有任何宣传,直接发布了他们的AI视频大模型。可灵。
2024-12-13 20:45:55 -
Stable Diffusion 3最新模型测评丨SD3模型ComfyUI流程简单搭建
由于前不久StabilityAI开放了SD3新模型的使用权,这期我们就简单聊聊这款新模型的使用方法,以及StabilityAI对于SD3模型的发布策略,和未来的发展预期!如果本期讯息对大家有所帮助,就点赞关注支持欧阳一下吧!
2024-12-13 21:10:24 -
科大讯飞星火大模型3.0实测:高能进化,给AI注入灵魂,部分能力与GPT-4旗鼓相当
科大讯飞星火认知大模型3 0正式发布。星火3 0的整体性能已经超越ChatGPT,部分能力与GPT-4旗鼓相当。科大讯飞立下又一个Flag,星火4 0要对标GPT-4
2024-12-13 22:43:43