OpenAI推出视觉大模型GPT-4V,为ChatGPT加入眼睛和耳朵丨抖音APP上线方言AI翻译功能丨百度发布首个量子大模型
AI奇点网2023年9月27日报道丨AI资讯早报
OpenAI推出视觉大模型GPT-4V,为ChatGPT加入眼睛和耳朵
当地时间9月25日,OpenAI官网宣布,ChatGPT APP中将会推出新的语音和图像功能,允许用户进行语音对话、上传图像。
据介绍,新的语音功能由新的文本转语音模型提供支持,能够仅从文本和几秒的样本语音中生成类似人类的音频,OpenAI与专业配音演员合作创作了每一个声音,并使用开源语音识别系统Whisper将用户的口语转录为文本;图像理解由多模态GPT-3.5和GPT-4提供支持,这些模型将其语言推理技能应用于各种图像,例如照片、屏幕截图以及包含文本和图像的文档。
同一天,OpenAI还在官网发布多模态视觉模型系统GPT-4V(Vision)的论文。据介绍,GPT-4V使用户能指示GPT-4分析用户提供的图像输入,其训练于2022年完成,并在2023年3月开始提供早期访问系统。该系统卡概述了OpenAI如何为GPT-4部署视觉功能,并分析了GPT-4V的安全属性。
抖音APP上线方言AI翻译功能
根据抖音官方介绍,抖音APP于近期上线了方言自动翻译功能,创作者可以为地方方言的视频一键生成普通话字幕,方便各地的公众观看。目前,新功能第一期已经上线,支持粤语、闽语、吴语(上海)、西南官话(四川) 、中原官话(陕西、河南) 等。
据介绍,抖音的火山引擎技术团队采用了自研的自监督预训练模型和多语言翻译模型,实现了极少量标注数据条件下识别方言的能力,且训练效率提升一倍,有效提升了多语言翻译的性能,同时大幅度降低了模型训练的资源消耗。
华为云:盘古气象大模型新增降水预测功能,9月30日内测
华为云近日宣布,盘古气象大模型将会推出降水预测功能,并计划于 9 月 30 日开启全球邀测。据介绍,此次带来的降水预测功能可以实现对未来 6 小时、24 小时短中期降水预测,还将挑战对暴雨红色预警的预测从提前 3 小时升级至提前 24 小时。
盘古气象大模型在过去 40 年全球气象数据基础上,增加 10 年卫星降水数据,并采用 3D EST-3 地球空间网络训练优化。目前已经在欧洲中期天气预报中心官网上线服务。全球的天气预报员、气象爱好者与公众都可以免费查看盘古对未来 10 天全球各地气温的预测。
全球最大商业图库宣布推出AI图像生成工具
全球最大的商业图库Getty Images将与英伟达合作推出生成式 AI 工具。它的名字也很直白:Generative AI by Getty Images(Getty Images的生成式 AI工具)。
据介绍,这款工具允许用户在 Getty Images 庞大的图库中进行训练,也意味着任何使用这种工具、商业发布该工具创作图片的人都会受到法律保护。Getty Images 还表示,使用这款工具声称的任何照片都不会被收录到自家主站和 iStock 的内容库中。
该工具将与标准版的 Getty Images 订阅进行分开定价。用户对其生成的图像享有永久性、全球化和无限制的权利,不过 Getty 会给生成的图片打上水印,以强调这是由 AI 生成的图片。
百度发布首个量子大模型,5分钟内就可以完成上万字专利文档
9 月 23-24 日2023 量子产业大会举行,百度量子计算研究所所长段润尧官宣了公司量子软硬件和解决方案等方面的最新成果:首个量子领域大模型和两大原生 AI 应用 —— 百度量子助手、量子写作助手。
据介绍,该量子领域大模型是在百度大模型“文心一言”基础上,依托于百度量子知识库、产业级知识增强文心大模型,基于 7800 万原始数据、22 万精调数据训练打造而成的。使用量子领域高质量数据进行更有针对性训练和优化而构建的,能够更好理解量子知识、专业执行量子任务。
“量子写作助手”则号称实现了量子领域知识和技术准确、高效输出,可降低量子计算学习门槛,提高量子计算科研效率。只需输入 6 个变量,量子写作助手就可在 5 分钟内撰写一篇 13000 字的专利文档,且符合格式要求。
-
OpenAI推出视觉大模型GPT-4V,为ChatGPT加入眼睛和耳朵丨抖音APP上线方言AI翻译功能丨百度发布首个量子大模型
【AI奇点网2023年9月27日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-02 13:48:08 -
全新升级AI服务的Windows 11秋季更新已经推送丨外媒爆料:微软正在独自开发新模型丨OpenAI最新估值达900亿美元
【AI奇点网2023年9月28日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-02 13:23:12 -
AI数字人的潜力:我认为,这可能是一种很新的未来
元宇宙的概念基本就破产了……然而数字人却没有跟随元宇宙沉寂,而是在AI时代,成为了一个非常重要的发展方向。
2025-04-02 13:03:09 -
ChatGPT最新更新_ChatGPT更新绘画_跟ChatGPT对话是一种什么体验
最近,ChatGPT又有非常炸裂的更新了 OpenAI发布了他们家的一个AI绘画软件 Dell E3 并且这次的Dell E3要和TrackGPT正式合体了,这一更新可能会颠覆之前所有的AI绘画软件
2025-04-02 12:43:00 -
Getty Images发布AI图像生成器_版权永久+全球使用+商用无限制
全球知名的在线商业图库Getty Images曾经表示不接受人工智能生成的图像。9月25日,Getty Images正式官宣,将与英伟达合作开发一款人工智能图像生成器。
2025-04-02 12:19:21 -
谷歌发布首款AI大模型手机Pixel 8系列丨Photoshop网页版上线,支持多项AI功能丨OPPO推出自研大模型
【AI奇点网2023年10月7日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-02 11:58:04
-
小米公司开启小爱AI大模型多模态能力内测:支持图片内容问答、AI扩图、消除路人,适配小米14、Redmi K70等
3月15日,小米官方宣布小米社区开启新一轮的小爱AI大模型内测。现已开启“小爱同学多模态功能内测”。
2025-02-07 13:53:52 -
AI会议整理软件_通义听悟使用教程
最近还挺多人在群里问,有没有啥好的总结会议生成纪要的AI,所以今天更新一篇这个教程,也算是补上AI办公的拼图。
2024-12-17 16:12:59 -
你已经是个“成熟的AI”,可以帮我代肝了:智谱AI联合清华大学团队打造视觉大模型CogAgent:可提供《原神》教学辅助
日,清华大学与旗下孵化的人工智能创企智谱AI合作,联合推出了新一代视觉GUI Agent图像理解大模型 CogAgent,可告知《原神》游戏操作步骤等
2025-02-20 17:54:39 -
AI代理将主导2025年,而不是ChatGPT
很多人工智能专家和预测者都认为,今年该领域最大的趋势之一是 AI 代理,它与 Claude 或 ChatGPT 等生成式 AI 模型不同。AI 代理也不同于定制 GPT。以下是它们各自的主要区别。 生成式 AI: 专注于根据用户输入创
2025-02-21 09:08:08 -
OPPO公布AndesGPT大模型最新升级:70亿参数端侧模型,OPPO Find X7系列首发搭载,小布助手能力全面提升
在会上,OPPO 公布了自研的”安第斯大模型“ AndesGPT 的全新升级,为行业内”首个端侧应用70亿参数大模型“的手机厂商。
2025-02-21 09:08:06 -
银河证券:DeepSeek的技术颠覆带来的是AI行业的多元化,有望加速AI行业的普及繁荣
每经快讯,银河证券研报认为,DeepSeek通过算法及工程创新,显著降低成本。结合银河证券对芯片、硬件、软件、应用端等的影响分析,DeepSeek的技术颠覆带来的是AI行业的多元化,有望加速AI行业的普及繁荣。建议关
2025-02-21 13:40:54 -
谷歌Gemini自称文心一言?!一个BUG牵出AI大模型重大难题:全球陷入高质量训练数据荒,2024年或将枯竭
当地时间12月22日,外网内网的网友们激动地奔走相告:Gemini承认自己是用文心一言训练中文语料的。这听起来就是个段子,简直魔幻。
2025-02-21 16:58:14 -
为人工智能发展提供要素支撑
长广溪智能制造(无锡)有限公司的协作机器人在进行汽车智能部件自动装配。孙 斌摄 数据来源:工业和信息化部等 习近平总书记强调,人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能
2025-02-21 16:59:00 -
软银联手OpenAI成立合资公司 打造日本的人工智能帝国
当地时间周一(2月3日),软银集团在官网宣布,OpenAI将与其成立一家名为“SB OpenAI Japan”的合资公司,合作开发和推广高级企业人工智能“Cristal intelligence”。 另外,软银每年将投资30亿美元在集团内部部署Op
2025-02-24 09:40:05 -
加力支持人工智能发展 浙江将出台三年行动计划
发布会现场。浙江省政府新闻办 供图 中新网杭州1月23日电(记者 王逸飞)23日,在于杭州举行的浙江省2025年经济政策新闻发布会上,浙江省发展改革委党组书记、主任杜旭亮介绍,浙江近期将出台《浙江省“人工智能+”
2025-02-25 12:39:08