阿里发布“通义听悟”智能音视频助理服务:基于通义千问大模型,首发免费领100小时
AI奇点网6月4日报道丨6月1日,阿里云举行AI产品应用发布会,宣布通义大模型进展,聚焦音视频内容的AI新品“通义听悟”正式上线,成为国内首个针对音频视频内容转制文本的大模型应用产品。
“通义听悟”接入了“通义千问”大模型的理解与摘要能力,可成为用户工作学习中的得力AI助手,帮助随时随地高效完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等。公测期间,用户可领取100小时以上免费音视频转写文字的时长。
“换一种方式,让音视频可以被轻松阅读、整理和分享。”阿里云CTO周靖人介绍,“通义听悟”是一款工作与学习的AI助手,它瞄准具有高知识附加值的音视频内容场景,比如开会、上课、访谈、培训、面试、直播、看视频、听播客等,能通过大模型等最新AI技术快速提炼和沉淀知识。
根据现场演示,听悟融合了10多项AI服务功能,可以全面提升知识从音视频向图文形态转化的效率。除了“听力好”,能高准确度生成会议记录、区分不同发言人,这个AI助手“悟性也极高”,大模型可以一秒给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。大模型一键提取PPT、针对多个音视频内容向AI提问、概括特定段落等功能近期也将上线。
“通义听悟”可自动为音视频生成全文摘要、章节概括、发言总结。针对一些细分场景,听悟还设置了不少“宝藏功能”:打开阿里云开发的“通义听悟”Chrome插件,外语学习者和听障人士可以借助双语悬浮字幕条随时随地看无字幕视频,日程冲突时,听悟还可成为职场人士的“开会替身”,在静音情况下入会AI可代为记录会议、整理要点;转写结果可下载为字幕文件,方便新媒体从业者视频后期制作;听悟梳理的问答回顾可以让记者、分析师、律师、HR等群体整理访谈更高效。
值得一提的是,“通义听悟”的另一显著优势是,听悟与阿里云盘打通,支持一键导入阿里云盘音视频文件,一键就能转写云盘上的音视频内容,公测期间注册的听悟用户后续还将获得更大的阿里云盘存储空间,在云盘内在线播放视频时也可自动出字幕。
周靖人介绍,听悟集成了阿里最先进的语音和语言技术。其内置阿里新一代“工业级语音识别模型”,识别准确率在多个权威中文数据集上名列第一;融合自研语音语义多模态说话人算法,能对10人以上说话场景进行角**分;接入“通义千问”大模型后,能够对上万字的音视频内容进行摘要总结,事实准确与要点完备性国内领先,支持跨多音视频内容的精准问答理解。
继史无前例的大降价后,阿里云再次送出人人都能用上的AI“大礼包”。此前国内语音厂商AI转写定价达19.8元每小时,而听悟用户可通过每日登陆等多种任务领取免费转写时长。公测期间,阿里云官方微博、微信及各大平台社区还会发放大量20小时的一次性转写口令码,用户获得的福利权益可累积叠加,免费时长可叠加高达100小时以上,价值上千元的产品。
据了解,除了个人版本外,阿里还准备了企业应用。此前,“通义千问”企业版已在阿里集团内部被广泛使用,帮助减少了大量会议记录和整理的工作,受到好评。同时,“通义千问”的能力也可嵌进各类音视频平台,形成实时字幕、智能摘要等,比如钉钉APP的“钉闪记”背后其实就集成了“通义听悟”的能力。据悉,未来阿里还将在夸克APP、阿里云盘等端口提供相关服务。
-
阿里发布“通义听悟”智能音视频助理服务:基于通义千问大模型,首发免费领100小时
阿里云举行AI产品应用发布会,宣布通义大模型进展,聚焦音视频内容的AI新品“通义听悟”正式上线,成为国内首个针对音频视频内容转制文本的大模型应用产品。
2025-04-25 16:02:34 -
WWDC大会苹果将发布升级版Siri:或支持AIGC能力丨微软正式停止Cortana语音助手服务丨华为盘古聊天应用7月7日发布
【AI奇点网2023年6月5日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日资讯早餐。
2025-04-25 15:35:10 -
向AI发起提问衍生出一份新职业——提示词工程师
最近几个月,AI火爆空前,甚至催生了一个新职业,AI提示词工程师(Prompt Engineer)。AI提示词工程师接下来能否真的成为一个独立的职业呢?
2025-04-25 15:09:31 -
华为盘古Chat七月登场:自然语言对话能力比肩GPT-3.5
华为公司计划在7月7日举行一年一度的华为云HDC 2023开发者大会,届时将发布一款直接对标ChatGPT的多模态千亿级大模型产品,名为“盘古Chat”。
2025-04-25 14:46:43 -
号称千亿级参数量冠绝全球:华为盘古大模型到底是个啥水平?
根据华为官方最新披露的信息显示,需要明确说明的是,华为盘古大模型是一个系列,而不是一个独立的大型语言模型。
2025-04-25 14:24:08 -
号称中文千亿参数量「地表最强」:华为盘古大模型到底是个啥水平?
华为盘古大模型为业界首个超千亿级参数的中文预训练大模型,与ChatGPT等国外AIGC大语言模型相比,华为盘古大模型更注重本土语言优化。
2025-04-25 14:01:44
-
AI绘画ComfyUI进阶教程丨如何实现Clip精准控图,流程自动化入门!
大家好,又到学习时刻? 本期跟大家分享CLIP构图相关的一些进阶基础内容,以及自动化逻辑编程基础,希望能对大家有所启发,最后不要忘记支持欧阳一波啦?!
2024-12-17 13:16:14 -
大语言模型「新王」Claude 3全面测评:原生多模态大模型各项能力实力超群,连打麻将都学会,实测比GPT-4好用
OpenAI「不可战胜」的神话,看样子是要被打破了。Claude 3的多版本发布后,“中杯”Sonnet直接免费体验,“大杯”Opus充个会员也能即刻享受,各路测评纷至沓来。
2024-12-13 18:57:45 -
有手就行:Stability AI推出简笔画生成图片工具Stable Doodle
近日,图像生成模型 Stable Diffusion 背后的初创公司 Stability AI 推出了一项新的服务,可以将简笔画转换为图像。这项服务名为 Stable Doodle,利用最新的 Stable Diffusion 模型分析简笔画的轮廓,让每个人都能得到堪称艺术的作品。
2025-04-10 13:09:46 -
阿里云通义千问上线AIGC春节新玩法:AI帮你免费拍摄全家福,AI舞蹈视频生成器“全民舞王”新增春晚舞蹈
春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法。
2025-02-13 15:39:26 -
阿里旗下夸克APP上线“AI学习助手”:内置海量试题,拍照一键解疑,巧用大模型帮助当代学子高效备考、快速进阶
夸克“AI学习助手”采用夸克宝宝的虚拟形象为用户进行题目讲解。基于大语言模型和视觉技术,AI智能讲解能够给用户提供 “考点分析”、“详解步骤”、“答案总结”等详细内容。
2025-02-18 16:08:16 -
应用商店下载排行第一,“Meta版推特”Threads注册用户超5000万
新上线社交应用Threads已注册激活用户超过5000万,该数字仍在持续增长。当前在英国和美国苹果应用商店免费应用中的下载量排名第一。
2025-04-14 13:36:13 -
网易出品的免费AI在线绘画工具:AI绘画工坊,安利给大家
网易出品推出的云端Stable Diffusion简直太好用了,集成了多种模型任你选,想生成什么类型的图像都超级容易。
2024-12-16 09:26:04 -
AI绘画ComfyUI进阶教程丨插件IPAdapter的详细使用教程,风格模仿,换脸全靠它
哈咯大家好,本期正式给大家带来进阶部分的插件讲解教程,虽然很多朋友一直在用IPA但可能很多朋友还不太了解其结构,希望这期关于ipa用法的教程能对大家有所帮助吧!
2024-12-17 22:49:30 -
抖音开启AI搜索功能灰度测试丨OpenAI CEO奥特曼:2024年无法实现AGI丨夸克APP上线“健康大模型”
【AI奇点网2023年12月26日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-21 17:23:50 -
字节跳动公测首个AI聊天机器人App“豆包”丨快手首个大语言模型“快意”亮相丨腾讯:下半年发布自研基础大模型
【AI奇点网2023年8月21日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-04 15:01:22