OpenAI推出AI Agent“深度研究”,分析师要失业了?
当地时间2月2日,OpenAI在直播中宣布推出一款全新的AI代理(AI Agent),名称叫做“深度研究”(Deep Research),旨在帮助用户利用ChatGPT进行深入、复杂的研究。

OpenAI表示,该功能专为“在金融、科学、政策和工程等领域从事高强度知识工作的人员”设计,提供全面、精准、可靠的研究支持,并且,该功能同样适用于需要进行细致调研的大宗消费决策,例如汽车、家电、家具购买等。
简单来说,ChatGPT的“深度研究”功能适用于那些不只想要快速获取答案或摘要,而是需要综合考虑多个网站及其他信息来源,不断深入挖掘直到找到最合适的答案的任务。

Altman写道:
“它可以去互联网,做复杂的研究和推理,然后给你一份报告。它真的很好,可以完成需要数小时/数天且花费数百美元的任务。”
“它计算量很大且速度很慢,但它是第一个可以执行如此广泛复杂、有价值的任务的AI系统。”

对此,网友们跃跃欲试,有人“已经准备好使用它了”,还有人自报账号请求先一步用上ChatGPT的“深度研究”功能:


也有人提出疑问,ChatGPT的“深度研究”功能比谷歌的“深度研究”功能更强吗?会不会存在隐私问题?能不能把报告中每句话的首字母大写?




限定发布,未来将拓展至更多用户
Altman表示,ChatGPT的“深度研究”功能目前仅向ChatGPT Pro订阅用户开放,每月限额100次查询,随后将逐步推广至Plus和Team用户,最终扩展至企业级(Enterprise)用户。预计Plus版本将在约一个月后推出,并且未来付费用户的查询限制将“显著提高”。

对此,许多网友表示,200美元/月的ChatGPT Pro订阅费用太贵了:
不是免费的谁在意啊。

还有网友猜测道,等之后实现了AGI,是不是要每月收取2000美金,限额使用10次?

其实,Altman表示,免费用户也能使用,但额度非常少。

需要注意的是,“深度研究”功能目前仅在特定地区推出,OpenAI尚未公布该功能何时向英国、瑞士及欧洲经济区(EEA)用户开放。
目前,ChatGPT 深度研究的输出仅限于文本格式。不过,OpenAI计划在未来增加嵌入式图像、数据可视化及其他“分析型”输出。此外,OpenAI还表示,未来将支持接入“更多专业化的数据源”,包括“订阅制”数据库和内部资源。

研究精度如何?AI仍存局限
分析师要大面积失业了吗?关键在于,ChatGPT“深度研究”功能的精准度能否满足专业研究需求?毕竟,AI并不完美,仍然存在“幻觉”(hallucination)问题,即生成错误或虚假信息的可能性。
考虑到这一点,OpenAI透露,每次深度研究的输出都将“完整记录,附带清晰的引用来源及推理摘要,便于用户参考和验证信息”。
不过,分析认为,这一举措是否足以避免AI误导用户仍待观察——此前,OpenAI在ChatGPT内推出的AI搜索功能(ChatGPT Search)已被曝出存在错误回答的问题。TechCrunch评测发现,ChatGPT Search在某些查询上甚至不如谷歌搜索可靠。

增强精准度:使用专门优化的o3版本AI模型
为了提高深度研究的准确性,OpenAI采用了一种特殊版本的o3“推理”AI 模型,该模型经过强化学习(reinforcement learning)训练,专门针对“需要使用浏览器和Python工具的实际任务”。
OpenAI表示,该版本的o3模型“针对网页浏览和数据分析进行了优化”,可以“利用推理能力搜索、解读和分析互联网海量文本、图片及PDF,并根据新获取的信息灵活调整策略。”
该模型还可以浏览用户上传的文件,绘制并迭代调整图表,在回答中嵌入生成的图表及网页图片,并引用来源中的具体句子或段落。
为了测试该模型的效果,OpenAI采用了一项名为“人类终极考试”(Humanity’s Last Exam)的评估方法,该测试涵盖3000多道高难度学术问题,远超其他AI评估基准,以确保测试难度始终领先于模型的进步水平。
ChatGPT“深度研究”功能所使用的o3模型在测试中的准确率为26.6%——这一成绩看似不高,但相比之下,已经远超其他AI模型的得分:
谷歌 Gemini Thinking:6.2%
xAI Grok-2:3.8%
OpenAI GPT-4o:3.3%
不过,尽管如此,OpenAI仍然承认,ChatGPT“深度研究”功能存在局限性,可能会出现错误推断、误解权威信息与谣言的情况,并且,在面对不确定性时往往无法明确表述。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则