美图发布视觉大模型Miracle Vision3.0丨华为“小艺”将支持通话语音转文本丨视觉中国与华为研发视觉大模型

2025-04-02 来源：AI图库吧

AI奇点网2023年10月10日报道丨AI资讯早报

美图发布自研视觉大模型3.0，全面应用于美图旗下的影像与设计产品

10月9日，美图公司举办15周年生日会，在活动上，美图自研AI视觉大模型Miracle Vision3.0版本正式发布，将全面应用于美图旗下影像与设计产品，并将助力电商、广告、游戏、动漫、影视五大行业“工作流提效”。

美图创始人、董事长兼CEO吴欣鸿将Miracle Vision的核心能力拆解为“奇思妙想”和“智能创作”两大特性，其中，在“奇思妙想”层面，Miracle Vision通过“提示词智能联想”功能降低大众的使用门槛，而在“智能创作”层面，Miracle Vision则通过“深化创作”功能，进一步丰富作品细节和提升表现力；在应用领域方面，Miracle Vision将持续在电商、广告、游戏、动漫、影视五大行业深耕。“吴欣鸿强调，AI视觉大模型的出现，不是要取代现有的从业者，而是帮助他们提升工作效率。”

华为对外展示“小艺助手”通话语音转文本功能

10月8日，华为终端BG CTO李小龙在微博上剧透了华为鸿蒙语音助手“小艺”的通话及语音转写功能，并声称新功能很好用。他以AI帮助接听平安车险的销售经理的电话为例，“小艺”可以帮助用户对付销售电话的来访。

有网友在评论区询问，该功能是否可以模仿机主声音，李小龙回应称，用户可以自己录制开场语。

视觉中国与华为云达成视觉大模型研发合作，基于盘古大模型开发

视觉中国宣布，近日，该公司与华为云正式签署关于视觉大模型的合作协议。双方将以华为云盘古大模型为基础打造视觉大模型，共同实现视觉领域高度智能化发展，推进更深层次的内容产业智能转型。

今年7月的华为云HDC 2023开发者大会上，视觉中国作为华为云大模型高质量数据联盟首倡单位参与了大会,视觉中国总裁柴继军在大会AI圆桌论坛上介绍了视觉中国“AI+内容+场景”战略。

华人团队提出交错视觉语言生成模型MiniGPT-5

10月3日，加州大学圣克鲁兹分校的华人AI研究团队提出了一种新的视觉大模型解决方案——MiniGPT-5。这是一种以”生成式Voken“概念为基础的创新型交错视觉语言生成技术。

据介绍，通过特殊的视觉Token”生成式Voken“，MiniGPT-5将Stable Diffusion的扩散模型机制，与以ChatGPT为代表的LLM（大型语言模型）相结合，为更强大的大模型多模态生成能力预示了一种新的模式。

除了原有的多模态理解和文本生成能力外，MiniGPT5还支持提供合理、连贯的多模态信息输出。

OpenAI奥特曼：简单模仿&封装ChatGPT的公司活不久

9月22日-24日，OpenAI CEO奥特曼出席YC Alumni Reunion 2023校友会，并做演讲，他提出一些创业建议。据网友总结，其观点大致可以分为三点：

简单包装OpenAI的公司活不长久看好AI医学顾问、AI个性化一对一辅导等方向盲目筹资非常不明智

此外有消息称，奥特曼在本次演讲中剧透了下一代大模型的研发方向，并称GPT-5和GPT-6将具备多模态输出能力，相比目前的GPT版本可靠性更高、个性化定制体验更好。

美图发布MiracleVision 3.0自研视觉大模型，赋能电商广告游戏动漫影视

相关AI教程资讯

热门工具

本周AI教程资讯

更多