在今日的快闪直播中,OpenAI发布了ChatGPT智能体功能,该功能对数月前公布的Operator特性进行了全面升级。以下是具体运作方式
Operator与深度研究的融合
OpenAI将已具备代理浏览能力的Operator功能,与可快速消化理解网页内容并进行推理的深度研究技术相结合。
最终实现的智能体会在用户分配任务时启动虚拟机,随后自主执行操作。
它能通过追问澄清用户意图,并可要求用户登录服务以完成交易。
用户可随时接管进程,或在任务中途补充指令。
OpenAI构建ChatGPT智能体的方式颇具创意,主要整合了:
- 基于深度研究的文本浏览
- 通过Operator实现的视觉浏览
- 自主终端用于代码生成与数据分析
- 支持Google Drive、Google Calendar、GitHub及SharePoint等服务的API调用(包括公共与私有接口)
另一创新点是该智能体会向用户展示浏览推理过程的时间轴,使最终结果的每个环节都具备可追溯性。
新机遇与新风险并存
OpenAI表示已投入大量精力训练模型识别可疑网站,这些网站可能试图诱骗智能体或用户提交凭证,或在虚假平台消费。
但公司仍多次强调这是全新领域,建议用户使用时保持警惕。
发布计划
据OpenAI首席执行官Sam Altman透露,ChatGPT智能体即日起向Pro用户开放,Plus和Team用户将”很快”获得权限。
Pro用户每月可进行400次查询,Plus和Teams用户每月限额40次。
公司计划七月底前向Enterprise和Edu用户开放该功能。