分析师的黄昏？OpenAI推出AI Agent“深度研究”

2025-02-21 来源：AI图库吧

OpenAI推出AI Agent“深度研究”，分析师要失业了？

当地时间2月2日，OpenAI在直播中宣布推出一款全新的AI代理（ai agent），名称叫做“深度研究”（Deep Research），旨在帮助用户利用ChatGPT进行深入、复杂的研究。

OpenAI表示，该功能专为“在金融、科学、政策和工程等领域从事高强度知识工作的人员”设计，提供全面、精准、可靠的研究支持，并且，该功能同样适用于需要进行细致调研的大宗消费决策，例如汽车、家电、家具购买等。

简单来说，ChatGPT的“深度研究”功能适用于那些不只想要快速获取答案或摘要，而是需要综合考虑多个网站及其他信息来源，不断深入挖掘直到找到最合适的答案的任务。

Altman写道：

“它可以去互联网，做复杂的研究和推理，然后给你一份报告。它真的很好，可以完成需要数小时/数天且花费数百美元的任务。”

“它计算量很大且速度很慢，但它是第一个可以执行如此广泛复杂、有价值的任务的AI系统。”

对此，网友们跃跃欲试，有人“已经准备好使用它了”，还有人自报账号请求先一步用上ChatGPT的“深度研究”功能：

也有人提出疑问，ChatGPT的“深度研究”功能比谷歌的“深度研究”功能更强吗？会不会存在隐私问题？能不能把报告中每句话的首字母大写？

限定发布，未来将拓展至更多用户

Altman表示，ChatGPT的“深度研究”功能目前仅向ChatGPT Pro订阅用户开放，每月限额100次查询，随后将逐步推广至Plus和Team用户，最终扩展至企业级（Enterprise）用户。预计Plus版本将在约一个月后推出，并且未来付费用户的查询限制将“显著提高”。

对此，许多网友表示，200美元/月的ChatGPT Pro订阅费用太贵了：

不是免费的谁在意啊。

还有网友猜测道，等之后实现了agi，是不是要每月收取2000美金，限额使用10次？

其实，Altman表示，免费用户也能使用，但额度非常少。

需要注意的是，“深度研究”功能目前仅在特定地区推出，OpenAI尚未公布该功能何时向英国、瑞士及欧洲经济区（EEA）用户开放。

目前，ChatGPT 深度研究的输出仅限于文本格式。不过，OpenAI计划在未来增加嵌入式图像、数据可视化及其他“分析型”输出。此外，OpenAI还表示，未来将支持接入“更多专业化的数据源”，包括“订阅制”数据库和内部资源。

研究精度如何？AI仍存局限

分析师要大面积失业了吗？关键在于，ChatGPT“深度研究”功能的精准度能否满足专业研究需求？毕竟，AI并不完美，仍然存在“幻觉”（hallucination）问题，即生成错误或虚假信息的可能性。

考虑到这一点，OpenAI透露，每次深度研究的输出都将“完整记录，附带清晰的引用来源及推理摘要，便于用户参考和验证信息”。

不过，分析认为，这一举措是否足以避免AI误导用户仍待观察——此前，OpenAI在ChatGPT内推出的AI搜索功能（ChatGPT Search）已被曝出存在错误回答的问题。TechCrunch评测发现，ChatGPT Search在某些查询上甚至不如谷歌搜索可靠。

增强精准度：使用专门优化的o3版本AI模型

为了提高深度研究的准确性，OpenAI采用了一种特殊版本的o3“推理”AI 模型，该模型经过强化学习（reinforcement learning）训练，专门针对“需要使用浏览器和Python工具的实际任务”。

OpenAI表示，该版本的o3模型“针对网页浏览和数据分析进行了优化”，可以“利用推理能力搜索、解读和分析互联网海量文本、图片及PDF，并根据新获取的信息灵活调整策略。”

该模型还可以浏览用户上传的文件，绘制并迭代调整图表，在回答中嵌入生成的图表及网页图片，并引用来源中的具体句子或段落。

为了测试该模型的效果，OpenAI采用了一项名为“人类终极考试”（Humanity’s Last Exam）的评估方法，该测试涵盖3000多道高难度学术问题，远超其他AI评估基准，以确保测试难度始终领先于模型的进步水平。

ChatGPT“深度研究”功能所使用的o3模型在测试中的准确率为26.6%——这一成绩看似不高，但相比之下，已经远超其他AI模型的得分：

谷歌 Gemini Thinking：6.2%

xAI Grok-2：3.8%

OpenAI GPT-4o：3.3%

不过，尽管如此，OpenAI仍然承认，ChatGPT“深度研究”功能存在局限性，可能会出现错误推断、误解权威信息与谣言的情况，并且，在面对不确定性时往往无法明确表述。