电影中的人工智能来了!OpenAI发布全能大模型:文图音任意组合输出,可实现人类级别响应
北京时间5月14日凌晨,OpenAI发布最新多模态大模型 GPT-4o(o代表omini,全能),支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。文本、推理和编码智能方面性能达到了GPT-4 Turbo水平,同时在多语言、音频和视觉能力方面也达到新高。据介绍,GPT-4o的速度比GPT-4 Turbo快2倍,速率限制提高5倍,最高可达每分钟1000万token,而价格则便宜了一半。
OpenAI首席技术官米拉·穆拉蒂(Muri Murati)在发布会上表示:“通过语音、文本和视觉进行推理非常重要,因为我们正在研究与机器交互的未来。”
官网显示,GPT-4o的文本和图像功能将在ChatGPT更新后提供给所有用户,Plus用户的消息数量使用上限是免费版的5倍(使用上限后会切换回GPT-3.5版本)。而新版语音模式将在未来几周向Plus用户推出,同时也将会在API(应用接口)中向小范围推出对GPT-4o的新音频和视频功能的支持。

GPT-4o速度比GPT-4 Turbo快2倍,价格则便宜了一半
发布会上,ChatGPT还发布了电脑桌面版和新UI界面。根据官方公告,目前仅适用于macOS,Windows版将在今年晚些时候推出。
“我们知道这些模型越来越复杂,但我们希望交互体验变得更加自然、轻松,并且让你根本不关注用户界面,而是专注于与GPT(交互)。”穆拉蒂表示。
OpenAI CEO山姆·奥特曼(Sam Altman)也表示:“对我来说,与电脑交谈从来没有真正自然过,而现在却很自然……我真的看到了一个令人兴奋的未来,我们可以用电脑做比以往更多的事情。”
“AI达到人类级别的响应时间和表现力是一个很大的改变,给人的感觉就像电影中的人工智能,而它的真实性仍然让我感到有些惊讶。”他表示,“最初的ChatGPT展示了语言界面的雏形,而这款新模型给人的感觉却截然不同,它快速、智能、有趣、自然而且乐于助人。”
奥特曼还发文“her”,或许也表达了他对GPT-4o的评价以及对未来的畅想(在电影《Her》中,人工智能助手Samantha主动给男主人公打了电话,告知他一些事情)。

山姆·奥特曼的推文
奥特曼表示,OpenAI的一项重要使命就是免费(或以优惠价格)向人们提供功能强大的人工智能工具,“我感到非常自豪的是,我们在ChatGPT中免费提供了世界上最好的模型,并且没有广告或类似的东西”。
他表示:“我们是一家企业,会找到很多可以收费的东西,这将帮助我们为数十亿人提供免费、出色的人工智能服务(希望如此)。”
此前,据外媒报道,苹果公司已接近与OpenAI达成协议,今年将后者的部分技术引入iPhone,提供由ChatGPT支持的“聊天机器人”作为iOS 18中人工智能功能的一部分。
不过,苹果同时还与谷歌就授权Gemini聊天机器人进行了谈判。而谷歌将在OpenAI此次春季更新发布会之后一天举行I/O开发者大会,谷歌在大会的官方博文中曾提到“Gemini 时代”,预计将会发布Gemini大模型的最新动态。
-
电影中的人工智能来了!OpenAI发布全能大模型:文图音任意组合输出,可实现人类级别响应
北京时间5月14日凌晨,OpenAI发布最新多模态大模型 GPT-4o(o代表omini,全能),支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。文本、推理和编码智能方面性能达到了GPT-4 Turbo水
2025-05-08 16:41:49 -
AI遇上化学:“不可能”变为“可能”
8天完成688次化学实验,7天研究1000种催化配方……人类夜以继日多年才能完成的工作,人工智能(AI)在短时间内就能完成。 “AI从一个研究领域变成了一类赋能技术。”在12月9日至10日召开的香山科学会议第768次学术
2025-05-08 16:13:13 -
国金证券:持续看好AI基础设施 重点关注AI应用
国金证券研报指出,持续看好AI基础设施,重点关注AI应用。如果说2023年是AI训练的元年,2024年是AI推理的元年,那么2025年将是AI终端应用爆发的元年。主要归因于包括端侧AI、聊天机器人、自动驾驶等在内的“AI+X”
2025-05-08 15:48:01 -
显示产业+AI,成渝如何抓住机遇?
拿出几瓶饮料,对面大屏幕上立刻显示出该饮料的品类和品牌;在黑板上写出一道数学题,大屏幕上又立即给出解题思路……12月20日,在成渝新型显示产业高质量协同发展会上,欧洲科学院外籍院士申恒涛现场播放的一段视
2025-05-08 15:26:55 -
AI为游戏领域带来“新玩法”,业内人士说未来还有无限可能
受访者供图 毛发分明的妖怪,逼真形象的神仙……今年,国产首款3A游戏《黑神话:悟空》火爆出圈,其背后离不开强大的科技支撑。 当人工智能与游戏相结合,会发生怎样的“化学反应”? 12月24日,在由杭州
2025-05-08 15:04:00 -
无论是否关注,AI都正在深入我们的生活
当地时间5月30日,瑞士日内瓦,在国际电信联盟(ITU)“人工智能造福人类全球峰会”期间,一台人工智能的机器人在展台上展示。视觉中国供图 无论是否关注,AI都正在深入我们的生活。 一年多以前,人们还惊异于Cha
2025-05-08 14:39:43
-
ChatGPT怎么本地登录_GPT怎么使用_GPT本地项目
本期就ChatGPT的这次更新再次将完全新人使用指南提上日程,并对此次更新做些设想和想象。希望大家喜欢!
2024-12-19 07:41:20 -
AI绘画ComfyUI进阶教学丨Mask遮罩基础运用,IPA+CN+Lora+prompts+遮罩
本期开始正式进入遮罩相关的高级应用,这里我们会尝试为不同组件应用不同区域的遮罩,实现构图、效果的不同区域实现。希望本期内容能对大家有所帮助和启发,最后如果喜欢欧阳的教程就千万不要忘记支持一波啦!!!
2024-12-17 09:48:56 -
安利超强的AI视频剪辑工具,离线,免费,无需配置
给大家分享一款近期制作的AI分词自动剪辑视频的超强工具,助力大家大幅提升视频剪辑生产力!
2024-12-20 16:49:16 -
AIGC基础应用教程丨探索AI在图像放大中的工具使用
当给到的图像素材尺寸太小或者不清晰的时候,有哪些好的AI图像放大的工具可以使用?本期就给大家推荐一些好用的工具
2025-02-06 14:24:28 -
OpenAI推出视觉大模型GPT-4V,为ChatGPT加入眼睛和耳朵丨抖音APP上线方言AI翻译功能丨百度发布首个量子大模型
【AI奇点网2023年9月27日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-04-02 13:48:08 -
导演郭帆:因为引入AI技术,《流浪地球3》剧组将比上一部减少一半人
郭帆表示,“《流浪地球2》现场最多的时候同时有2200名剧组人员在场,“随着AI技术发展,我预计《流浪地球3》现场拍摄可能会减少到只剩下几百人,就能实现万人级别的工作协同。”
2025-04-21 11:38:20 -
2023智源大会启动:OpenAI CEO奥特曼和Midjourney创始人将亮相
据官方消息,第五届北京智源大会将于6月9日在北京召开。本届智源大会聚集了人工智能领域最关键的人物、最重要的机构。
2025-04-24 13:27:30 -
中信建投:端侧AI渐起 关注算力、连接、存储等环节
中信建投研报称,随着AI大模型能力不断迭代增长,模型之间差异在缩小,Meta、字节、小米等巨头开始大力布局端侧AI,抢夺AI Agent入口。2024年潜在的端侧AI爆品出现,AI眼镜成本曲线大幅下探,2025年有望成为其爆
2025-04-29 17:28:33 -
如何让AI绘制的图像高清化丨小白必看的全面科普教程丨附Upscayl使用教程
在最近半年和大家交流 AIGC 相关问题时,最让大家头疼的问题之一就是如何让 AI 绘制的图像更加清晰。受限于服务器或硬件本身的性能,很多时候我们无法一步得到自己满意的图像,而生成拥有高清细节的大图又是每一位 AI 绘画爱好者的追求。
2024-12-17 12:29:00 -
pika使用技巧_pika十大技巧怎么用
最近挺多小伙伴都拿到PIKA1 0的资格了。在这也很感谢Jessie让群友们优先体验PIKA1 0 。。感觉这两天她手都开冒烟了。。。作为已经用了2周的“元老”,我也总结了不少关于PIKA1 0的使用技巧和经验,我觉得这些可以让大家更好的体验更有趣的PIKA1 0哈哈。
2024-12-18 20:37:27