Moshi最新消息_Moshi多模态大模型
7月4日凌晨,法国知名开源AI研究实验室Kyutai在官网发布了,具备看、听、说多模态大模型——Moshi。
Moshi功能与OpenAI在5月14日展示的最新模型GPT-4o差不多,可以听取人的语音提问后进行实时推理回答内容。但GPT-4o的语音模式要在秋天才能全面开放使用,而Moshi已经提供使用了。
「AIGC开放社区」已经亲自测试,Moshi不锁区,填写一个邮箱地址就能直接使用,无需任何等待。值得一提的是,Moshi是支持手机移动端使用的,只不过对普通话支持较差,最好使用英语提问。
此外,Kyutai可能很快就会开源Moshi,公布代码、模型权重和论文。
免费体验地址:https://moshi.chat/?queue_id=talktomoshi
Moshi的使用流程非常简单,1)登录https://moshi.chat/?queue_id=talktomoshi
2)填写一个邮箱地址,然后点击join。如果是手机登录,系统会提示使用你的麦克风,因为这个产品对语音是一个硬性要求。如果你是PC端使用,也必须有麦克风,不然没法使用。
「AIGC开放社区」的真实使用过程
3)开始语音输入,你想提问的内容就行了。
下面这个是官方展示的案例,根据多轮语音连续对话,主要让Moshi用法语来一首关于巴黎的诗;接着用窃窃私语的方式描述一个神秘故事。
这个是模拟星际战舰指挥官与航程的故事,主要询问了一些到达目标航程,周围环境等内容。(由于听译的可能理解的不太全~~)
验了一下,主要问了Moshi几个简单问题:第一个,法国巴黎有哪些著名景点?Moshi:埃菲尔铁塔。
接着问,卢浮宫博物馆有哪些著名的展览物品?Moshi:世界名画蒙娜丽莎的微笑。
又问了,巴黎有哪些标志性建筑?Mosh:凯旋门,这是一个拥有悠久历史的建筑。
由于Moshi的论文还没有发布,「AIGC开放社区」就说一说自己的亲身使用体验吧。
1)响应速度超级快,本次测试使用的是国区线路,而Moshi的demo服务器在欧洲和美国,但当你用语音提问完问题后,几乎0延迟就能马上响应你的提问。Moshi官方给出的理论延迟是160毫秒。
2)不支持中文普通话,这一点还是能理解的,毕竟Moshi面向的国外用户群体,主流语言还是英语,同时也支持法语。
3)回答内容有限,Moshi虽然是语音输出内容,但详细程度比ChatGPT那种纯文本差好多,回答的内容只能是轮廓大概,相信以后产品会迭代更多。
4)使用方便快捷,几乎没有繁琐的注册流程,你只需要提交一个邮箱即可,马上就能帮助你非常方便。
5)Moshi听和说的能力有了,看的能力还没展示出来,这个功能估计以后也会添加吧,这样整个输出模式将更加完善。
6)这类产品对家教、教育行业是起到颠覆性作用,例如,让家教老师帮你反复讲解一道高数题,估计两遍人就比较恼了,而AI可以帮你循环讲解无数次,这对于教育帮助是巨大的。
7)期待国产类似的GPT-4o、Moshi产品出现,最好再支持一些闽南话、粤语、四川话、东北话等有特色的地方语言,就像汽车导航那样一定会非常有意思。
对于Moshi的发布,网友们还是相当兴奋的,在我们苦等GPT-4o的语音模式时,Moshi横空出现,期待他们更好的表现。
在推理延迟方面,Moshi似乎比GPT-4o更好。这一点从实际操作来看,确实是很快的。
刚试了一下Moshi的产品,其高效的推理响应以及低延迟,令人印象深刻,这就是我一直期待的产品。
继续称赞Moshi的低推理延迟。如果使用功能更高级的模型,即便推理时间长一些也没问题。确实现在,Moshi的回答内容还是太宽泛了。
已经有人急的不行,开始要源代码了,你们可是开放AI研究实验室啊~
-
Moshi最新消息_Moshi多模态大模型
7月4日凌晨,法国知名开源AI研究实验室Kyutai在官网发布了,具备看、听、说多模态大模型——Moshi。
2025-01-16 13:32:08 -
阶跃星辰最新动态_国产大模型阶跃星辰
最近,公司全体同事都在疯狂沉迷这款《大闹天宫MBTI》测试!各种直击打工人的灵魂拷问,让所有i人和e人在职场极限场景中反复拉扯。国产黑马和上影打造的原汁原味《大闹天宫》画风,简直让人一秒穿越回童年。
2025-01-16 13:06:41 -
周鸿祎盛赞华为AI=苹果+英伟达+OpenAI+亚马逊+微软模式通吃
近日有媒体采访360董事长周鸿祎,问道:“苹果与OpenAI联手,请你给华为AI发展指一条路,是走同样的道路,还是华为能够走出自己的路?”
2025-01-16 12:42:37 -
商汤发布首个“可控”人像视频模型Vimi丨“反AI”社交软件Cara登上美国社交应用TOP5丨盖茨:白领会比蓝领更早被AI取代
【AI奇点网2024年7月5日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-16 12:19:49 -
AI动漫视频生成_yoyo官方网站_yoyo功能及介绍
视频生成赛道又起新秀,而且还是二次元定制版!稳定产出电影级画面,一键文 图生成视频,即使是「手残党」也能复刻自己喜欢的动漫作品了。
2025-01-16 11:53:08 -
李彦宏:AI不会替代人类工作,闭源模型最能打丨商汤发布多模态大模型「日日新5o」丨可灵推出AI视频网页编辑器
【AI奇点网2024年7月8日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-16 11:29:49
-
怎么快速给模特换装_怎么用stable diffusion给模特换装
本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusion来辅助我们完成服装效果展示。本教程适用于电商设计场景、摄影场景等多个运用人物设计的实战中
2024-12-23 13:57:15 -
万万没想到,兵马俑都开始跳「科目三」:阿里云通义千问APP打造“全民舞王”视频创作工具,实测效果大赞
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
2024-12-13 16:46:26 -
AIGC落地实践!四招帮你快速搞定运营设计
回顾这一年,随着 AIGC 浪潮的爆发,在掌握AI工具已经成为设计师必备技能。今天这篇文章,通过三个案例流程拆解带大家从新时代设计工作流,到必备「四大招式」,到图标设计六大方向,到训练专属模型,再到全流程手把手拆解设计项目,绝对干货满满
2024-12-18 16:57:17 -
ChatGPT怎么本地登录_GPT怎么使用_GPT本地项目
本期就ChatGPT的这次更新再次将完全新人使用指南提上日程,并对此次更新做些设想和想象。希望大家喜欢!
2024-12-19 07:41:20 -
stable diffusion初识_stable diffusion跟其他工具有什么区别]
关于Stable Diffusion的内容很多,在本篇教程里,我会先为你介绍Stable Diffusion模型的运行原理、发展历程和相较于其他AI绘图应用的区别。
2024-12-24 13:45:31 -
PikaAI怎么用_PIkaAI怎样生成视频_AI视频生成器Pika怎么用_AI视频生成工具Pika教程
Pika这款工具7月份在AIGC界横空出世,被圈内誉为目前“全球最好的文本生成视频AI工具”之一,也被认为是另外一款知名AI视频生成工具Runway的强有力挑战者。
2024-12-25 13:35:53 -
如何使用 ChatGPT 调试代码
当您的代码出现问题时,您可以向 ChatGPT 提供故障代码和问题描述。AI 工具将尝试识别并纠正问题。
2024-12-31 12:01:41 -
stable SR脚本安装_stable diffusion脚本网站
上节课我们讲的4xUltraSharp是不是觉得已经很强了! 那么如果我拿出Stable SR脚本你应该如何应对呢?
2024-12-31 13:49:18 -
怎么设置关键词权重_怎么设置Multi Prompts
AI 绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容(AIGC)的一个应用场景。其主要原理简单来说就是收集大量已有作品数据,通过算法对它们进行解析,最后再生成新作品,Midjourney是一个由同名研究实验室开发的人工智能程序。
2025-01-03 10:00:57 -
零基础2天速成!白嫖「秋叶」官方AI绘画课程,卷死同事
和「秋叶」一起学AI绘画,掌握Stable Diffusion、Midjourney的使用方法,开展AI绘画副业,搞钱!?
2024-12-17 12:53:01