美图发布视觉大模型Miracle Vision3.0丨华为“小艺”将支持通话语音转文本丨视觉中国与华为研发视觉大模型
AI奇点网2023年10月10日报道丨AI资讯早报
美图发布自研视觉大模型3.0,全面应用于美图旗下的影像与设计产品
10月9日,美图公司举办15周年生日会,在活动上,美图自研AI视觉大模型Miracle Vision3.0版本正式发布,将全面应用于美图旗下影像与设计产品,并将助力电商、广告、游戏、动漫、影视五大行业“工作流提效”。
美图创始人、董事长兼CEO吴欣鸿将Miracle Vision的核心能力拆解为“奇思妙想”和“智能创作”两大特性,其中,在“奇思妙想”层面,Miracle Vision通过“提示词智能联想”功能降低大众的使用门槛,而在“智能创作”层面,Miracle Vision则通过“深化创作”功能,进一步丰富作品细节和提升表现力;在应用领域方面,Miracle Vision将持续在电商、广告、游戏、动漫、影视五大行业深耕。“吴欣鸿强调,AI视觉大模型的出现,不是要取代现有的从业者,而是帮助他们提升工作效率。”
华为对外展示“小艺助手”通话语音转文本功能
10月8日,华为终端BG CTO李小龙在微博上剧透了华为鸿蒙语音助手“小艺”的通话及语音转写功能,并声称新功能很好用。他以AI帮助接听平安车险的销售经理的电话为例,“小艺”可以帮助用户对付销售电话的来访。
有网友在评论区询问,该功能是否可以模仿机主声音,李小龙回应称,用户可以自己录制开场语。
视觉中国与华为云达成视觉大模型研发合作,基于盘古大模型开发
视觉中国宣布,近日,该公司与华为云正式签署关于视觉大模型的合作协议。双方将以华为云盘古大模型为基础打造视觉大模型,共同实现视觉领域高度智能化发展,推进更深层次的内容产业智能转型。
今年7月的华为云HDC 2023开发者大会上,视觉中国作为华为云大模型高质量数据联盟首倡单位参与了大会,视觉中国总裁柴继军在大会AI圆桌论坛上介绍了视觉中国“AI+内容+场景”战略。
华人团队提出交错视觉语言生成模型MiniGPT-5
10月3日,加州大学圣克鲁兹分校的华人AI研究团队提出了一种新的视觉大模型解决方案——MiniGPT-5。这是一种以”生成式Voken“概念为基础的创新型交错视觉语言生成技术。
据介绍,通过特殊的视觉Token”生成式Voken“,MiniGPT-5将Stable Diffusion的扩散模型机制,与以ChatGPT为代表的LLM(大型语言模型)相结合,为更强大的大模型多模态生成能力预示了一种新的模式。
除了原有的多模态理解和文本生成能力外,MiniGPT5还支持提供合理、连贯的多模态信息输出。
OpenAI奥特曼:简单模仿&封装ChatGPT的公司活不久
9月22日-24日,OpenAI CEO奥特曼出席YC Alumni Reunion 2023校友会,并做演讲,他提出一些创业建议。据网友总结,其观点大致可以分为三点:
简单包装OpenAI的公司活不长久看好AI医学顾问、AI个性化一对一辅导等方向盲目筹资非常不明智此外有消息称,奥特曼在本次演讲中剧透了下一代大模型的研发方向,并称GPT-5和GPT-6将具备多模态输出能力,相比目前的GPT版本可靠性更高、个性化定制体验更好。
-
美图发布视觉大模型Miracle Vision3.0丨华为“小艺”将支持通话语音转文本丨视觉中国与华为研发视觉大模型
【AI奇点网2023年10月10日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-02 09:54:11 -
美图发布MiracleVision 3.0自研视觉大模型,赋能电商广告游戏动漫影视
美图公司15周年生日会现场,美图公司创始人、董事长兼首席执行官吴欣鸿发布了自研AI视觉大模型MiracleVision3 0版本。并将助力电商、广告、游戏、动漫、影视五大行业。
2025-04-02 09:30:48 -
美图绘画大模型升级3.0:AI技能点拉爆,APP一站解锁地表最全装逼玩法
美图自研大模型3 0 正式发布!并且全面应用于美图旗下影像与设计产品。小白AI修图神器最强担当,美图这波升级,爽飞了!
2025-04-02 09:03:49 -
谷歌Pixel 8手机将迎来多项AI新功能丨上海AI实验室开源多模态创作大模型丨ChatGPT全球流量高居第一
【AI奇点网2023年10月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-01 17:58:07 -
AI工具网站全球流量TOP50统计榜单(截止6月):ChatGPT稳居第一,大部分用户仍未深入使用
ChatGPT在榜单中排行第一;位居次席的是一款“主打个性化的AI聊天机器人”的网站Character ai;拿下第三的则是谷歌提供的Bard。
2025-04-01 17:34:14 -
谷歌Pixel 8系列手机AI新功能一览:语音转文本、智慧输入法、相册画质增强、AI语音助理…
谷歌对外发布了新一代Pixel 8 8 Pro系列智能手机,该手机搭载了一枚人工智能 Tensor G3 算力芯片。谷歌日前预告,将为这两款新机带来多项 AI 功能。
2025-04-01 17:07:44
-
小米公司开启小爱AI大模型多模态能力内测:支持图片内容问答、AI扩图、消除路人,适配小米14、Redmi K70等
3月15日,小米官方宣布小米社区开启新一轮的小爱AI大模型内测。现已开启“小爱同学多模态功能内测”。
2025-02-07 13:53:52 -
你已经是个“成熟的AI”,可以帮我代肝了:智谱AI联合清华大学团队打造视觉大模型CogAgent:可提供《原神》教学辅助
日,清华大学与旗下孵化的人工智能创企智谱AI合作,联合推出了新一代视觉GUI Agent图像理解大模型 CogAgent,可告知《原神》游戏操作步骤等
2025-02-20 17:54:39 -
AI代理将主导2025年,而不是ChatGPT
很多人工智能专家和预测者都认为,今年该领域最大的趋势之一是 AI 代理,它与 Claude 或 ChatGPT 等生成式 AI 模型不同。AI 代理也不同于定制 GPT。以下是它们各自的主要区别。 生成式 AI: 专注于根据用户输入创
2025-02-21 09:08:08 -
OPPO公布AndesGPT大模型最新升级:70亿参数端侧模型,OPPO Find X7系列首发搭载,小布助手能力全面提升
在会上,OPPO 公布了自研的”安第斯大模型“ AndesGPT 的全新升级,为行业内”首个端侧应用70亿参数大模型“的手机厂商。
2025-02-21 09:08:06 -
银河证券:DeepSeek的技术颠覆带来的是AI行业的多元化,有望加速AI行业的普及繁荣
每经快讯,银河证券研报认为,DeepSeek通过算法及工程创新,显著降低成本。结合银河证券对芯片、硬件、软件、应用端等的影响分析,DeepSeek的技术颠覆带来的是AI行业的多元化,有望加速AI行业的普及繁荣。建议关
2025-02-21 13:40:54 -
谷歌Gemini自称文心一言?!一个BUG牵出AI大模型重大难题:全球陷入高质量训练数据荒,2024年或将枯竭
当地时间12月22日,外网内网的网友们激动地奔走相告:Gemini承认自己是用文心一言训练中文语料的。这听起来就是个段子,简直魔幻。
2025-02-21 16:58:14 -
为人工智能发展提供要素支撑
长广溪智能制造(无锡)有限公司的协作机器人在进行汽车智能部件自动装配。孙 斌摄 数据来源:工业和信息化部等 习近平总书记强调,人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能
2025-02-21 16:59:00 -
软银联手OpenAI成立合资公司 打造日本的人工智能帝国
当地时间周一(2月3日),软银集团在官网宣布,OpenAI将与其成立一家名为“SB OpenAI Japan”的合资公司,合作开发和推广高级企业人工智能“Cristal intelligence”。 另外,软银每年将投资30亿美元在集团内部部署Op
2025-02-24 09:40:05 -
加力支持人工智能发展 浙江将出台三年行动计划
发布会现场。浙江省政府新闻办 供图 中新网杭州1月23日电(记者 王逸飞)23日,在于杭州举行的浙江省2025年经济政策新闻发布会上,浙江省发展改革委党组书记、主任杜旭亮介绍,浙江近期将出台《浙江省“人工智能+”
2025-02-25 12:39:08 -
关注人工智能“一号创新工程” 四川省政协委员徐汝金:加强产业人才培养|委员在这里
四川省政府工作报告提到,大力推进人工智能“一号创新工程”;支持在川高校开展重大科技攻关和基础研究,加快引育一流科技领军人才、青年科技人才和高水平创新团队。这与四川省政协委员、绵阳市科创孵化器管理有限
2025-02-25 13:00:46