分析师的黄昏?OpenAI推出AI Agent“深度研究”
OpenAI推出AI Agent“深度研究”,分析师要失业了?
当地时间2月2日,OpenAI在直播中宣布推出一款全新的AI代理(ai agent),名称叫做“深度研究”(Deep Research),旨在帮助用户利用ChatGPT进行深入、复杂的研究。

OpenAI表示,该功能专为“在金融、科学、政策和工程等领域从事高强度知识工作的人员”设计,提供全面、精准、可靠的研究支持,并且,该功能同样适用于需要进行细致调研的大宗消费决策,例如汽车、家电、家具购买等。
简单来说,ChatGPT的“深度研究”功能适用于那些不只想要快速获取答案或摘要,而是需要综合考虑多个网站及其他信息来源,不断深入挖掘直到找到最合适的答案的任务。

Altman写道:
“它可以去互联网,做复杂的研究和推理,然后给你一份报告。它真的很好,可以完成需要数小时/数天且花费数百美元的任务。”
“它计算量很大且速度很慢,但它是第一个可以执行如此广泛复杂、有价值的任务的AI系统。”

对此,网友们跃跃欲试,有人“已经准备好使用它了”,还有人自报账号请求先一步用上ChatGPT的“深度研究”功能:


也有人提出疑问,ChatGPT的“深度研究”功能比谷歌的“深度研究”功能更强吗?会不会存在隐私问题?能不能把报告中每句话的首字母大写?




限定发布,未来将拓展至更多用户
Altman表示,ChatGPT的“深度研究”功能目前仅向ChatGPT Pro订阅用户开放,每月限额100次查询,随后将逐步推广至Plus和Team用户,最终扩展至企业级(Enterprise)用户。预计Plus版本将在约一个月后推出,并且未来付费用户的查询限制将“显著提高”。

对此,许多网友表示,200美元/月的ChatGPT Pro订阅费用太贵了:
不是免费的谁在意啊。

还有网友猜测道,等之后实现了agi,是不是要每月收取2000美金,限额使用10次?

其实,Altman表示,免费用户也能使用,但额度非常少。

需要注意的是,“深度研究”功能目前仅在特定地区推出,OpenAI尚未公布该功能何时向英国、瑞士及欧洲经济区(EEA)用户开放。
目前,ChatGPT 深度研究的输出仅限于文本格式。不过,OpenAI计划在未来增加嵌入式图像、数据可视化及其他“分析型”输出。此外,OpenAI还表示,未来将支持接入“更多专业化的数据源”,包括“订阅制”数据库和内部资源。

研究精度如何?AI仍存局限
分析师要大面积失业了吗?关键在于,ChatGPT“深度研究”功能的精准度能否满足专业研究需求?毕竟,AI并不完美,仍然存在“幻觉”(hallucination)问题,即生成错误或虚假信息的可能性。
考虑到这一点,OpenAI透露,每次深度研究的输出都将“完整记录,附带清晰的引用来源及推理摘要,便于用户参考和验证信息”。
不过,分析认为,这一举措是否足以避免AI误导用户仍待观察——此前,OpenAI在ChatGPT内推出的AI搜索功能(ChatGPT Search)已被曝出存在错误回答的问题。TechCrunch评测发现,ChatGPT Search在某些查询上甚至不如谷歌搜索可靠。

增强精准度:使用专门优化的o3版本AI模型
为了提高深度研究的准确性,OpenAI采用了一种特殊版本的o3“推理”AI 模型,该模型经过强化学习(reinforcement learning)训练,专门针对“需要使用浏览器和Python工具的实际任务”。
OpenAI表示,该版本的o3模型“针对网页浏览和数据分析进行了优化”,可以“利用推理能力搜索、解读和分析互联网海量文本、图片及PDF,并根据新获取的信息灵活调整策略。”
该模型还可以浏览用户上传的文件,绘制并迭代调整图表,在回答中嵌入生成的图表及网页图片,并引用来源中的具体句子或段落。
为了测试该模型的效果,OpenAI采用了一项名为“人类终极考试”(Humanity’s Last Exam)的评估方法,该测试涵盖3000多道高难度学术问题,远超其他AI评估基准,以确保测试难度始终领先于模型的进步水平。
ChatGPT“深度研究”功能所使用的o3模型在测试中的准确率为26.6%——这一成绩看似不高,但相比之下,已经远超其他AI模型的得分:
谷歌 Gemini Thinking:6.2%
xAI Grok-2:3.8%
OpenAI GPT-4o:3.3%
不过,尽管如此,OpenAI仍然承认,ChatGPT“深度研究”功能存在局限性,可能会出现错误推断、误解权威信息与谣言的情况,并且,在面对不确定性时往往无法明确表述。
-
分析师的黄昏?OpenAI推出AI Agent“深度研究”
OpenAI推出AI Agent“深度研究”,分析师要失业了? 当地时间2月2日,OpenAI在直播中宣布推出一款全新的AI代理(AI agent),名称叫做“深度研究”(Deep Research),旨在帮助用户利用ChatGPT进行深入、复杂的研究
2025-02-21 11:10:55 -
OpenAI & 微软被纽约时报起诉侵权丨文心一言用户数已突破1亿丨优酷上线对话式影视搜索工具「AI搜片」
【AI奇点网2023年12月29日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-02-21 10:50:39 -
未来二十年,“人工智能体”会像人类一样感受这个世界吗?
《国家科技传播中心讲坛》为中国科协打造的新型演讲类新知栏目,以科学精神,科技探索和科技产业为主要讲述内容,汇集相关领域顶尖科技工作者讲述科技创新故事,传播前沿创新成果,弘扬科学家精神。本文摘选部分
2025-02-21 10:45:25 -
OpenAI被纽约时报起诉_midjourney生图或有版权
今天,纽约时报对OpenAI和微软正式提起诉讼,指控其未经授权就使用纽约时报内容训练人工智能模型。此案可能是人工智能使用知识版权纠纷的分水岭。
2025-02-21 10:23:36 -
DeepSeek/豆包模型迭代与Agent共振,继续布局AI
大模型迭代升级竞争加剧,Agent加快落地,继续布局AI应用。1月20日,DeepSeek(深度求索)发布全新大模型DeepSeek-R1,其在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的情况下大幅提升了模型推理能
2025-02-21 10:17:30 -
文心一言用户规模超一个亿_文心一言文本创作
今年国产大模型的最后一声枪响,属于百度,百度交了份“大”作业发布仅2个月,文心大模型4 0 能力又提升了32%。文心一言用户规模超过1个亿!
2025-02-21 09:57:22
-
AI视频后期消除对象神器ProPainter:一涂一抹,视频轻松移除指定对象丨本地离线一键部署
今天给大家介绍一款超强的一键删除视频内的移动物体和去除视频水印的工具ProPainter。本地部署比较麻烦,已经为大家制作好了离线整合包,解压即用。
2024-12-19 17:43:32 -
快手「可灵AI」全面开放内测,国际版上线丨Mistral发布1230亿Large 2旗舰模型丨OpenAI免费提供GPT-4o微调
【AI奇点网2024年7月25日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
2025-01-14 11:04:50 -
10年缘分说散就散:Ilya Sutskever官宣从OpenAI离职,麾下的“超级对齐团队”负责人也一并离职
5月14日,OpenAI 联合创始人、首席科学家 Ilya Sutskever 发推文对外宣告离职。作为联合创始人历经供职十载,OpenAI初创团队还是走散了
2025-01-26 13:54:56 -
爆火Sora震惊威尔·史密斯,真人整活吃意面视频丨OpenAI技术路线或早在1月被成功预言
威尔·史密斯的这段视频,把全网都骗了!其实Sora的技术路线,早已被人预言了。李飞飞去年就用Transformer做出了逼真的视频。但只有OpenAI大力出奇迹,跑在了所有人前面。
2025-02-13 09:47:49 -
openai取消每日限制_GPT-4 turbo取消每日限制
2月17日,OpenAI在社交平台宣布,取消了GPT-4 Turbo的所有每日限制,并将速率限制提升1倍。现在,每分钟可处理高达150万TPM的数据。
2025-02-13 10:38:31 -
商汤「日日新4.0」大模型测评:性能逼近GPT-4,全新「Assistants API」能力连OpenAI都只能自叹不如
近日,商汤官宣新一代大模型「日日新4 0」。大模型体系全面升级,不仅如此,商汤还领先推出全球首个支持不同模态下实现能力调用的Assistants API
2025-02-13 11:37:00 -
hugging face开源平替_Hugging Chat Assistant最新上线
抱抱脸新推出了OpenAI的GPT商店开源平替,“Hugging Chat Assistant”,也瞄准了让用户免费制定自定义聊天机器人。该软件完全免费,无需像OpenAI那样不开会员就被拒之门外。
2025-02-14 10:04:00 -
360 AI智能搜索APP上架移动应用商店:基于搜索结果快捷生成可追溯的整合型答案
“360 AI搜索”移动APP在国内的各大手机应用商城上线。这是一款免费的智能搜索工具软件,基于360自研的“360智脑”大模型开发。
2025-02-14 16:29:24 -
真实降维打击!Sora横向对比Runway、Pika、AnimateDiff、LeonardoAI四款主流AI视频生成模型
近日,国外一名创作者利用Sora官网上提供的提示词,比较了目前同赛道的几款竞品Runway Gen-2、AnimateDiff、Pika,LeonardoAI四款AI工具的生成效果。
2024-12-13 19:07:36 -
Midjourney新功能实操详解丨关于如何保存AI角色一致性“cref” 参数
midjourney新发布的角色一致性功能,通过使用该功能,可以稳定生成同一个角色。该功能类似于之前的风格参考功能,但这次参考的是人物的特征。
2024-12-17 23:37:39