AI能力新高度!OpenAI发布ChatGPT智能体:能自主选择工具完成任务
创始人
2025-07-18 11:00:16

ChatGPT可以自主调用电脑资源执行任务了。

当地时间7月17日,人工智能(AI)巨头OpenAI推出ChatGPT智能体(Agent)系统,OpenAI CEO山姆·奥特曼(Sam Altman)和四位负责人进行了25分钟的直播。

据介绍,这是一套融合Operator远程浏览器执行能力、Deep Research网络信息整合技术以及ChatGPT对话优势的统一智能体平台,“可以思考和行动,能够主动从代理技能工具箱中进行选择,使用自己的计算机为您完成任务”。

奥特曼表示,智能体代表了AI系统能力的新高度。

此前,Operator和Deep Research各有优势:Operator可以在网页上处理内容,而Deep Research则擅长分析和汇总信息。但Operator无法深入分析或撰写详细报告,而Deep Research无法与网站互动以优化结果或访问需要用户身份验证的内容。此次,OpenAI直接将两者的优势进行了结合。

ChatGPT在Agent模式中会使用自己的“虚拟电脑”执行任务,基于用户指令处理复杂的工作,用户可以主动与网站互动,或在同一聊天中直接从对话过渡到直接请求操作。 

在发布会上,OpenAI演示了用ChatGPT Agent同时进行买西装、做贴纸、订酒店等任务,Agent使用数秒启动虚拟电脑后便会询问用户明确需求,再进行衣服的挑选,Agent会滑动网页、点开商品详情,并留下相应的建议文字。此外,Agent也可以代替用户进行下单操作。

在“虚拟电脑”中,即使ChatGPT使用多种工具,也能保留任务所需的上下文,模型可以选择使用文本浏览器或可视化浏览器打开页面,从网络下载文件,通过在终端中运行命令进行操作,然后在可视化浏览器中查看输出。

同时,ChatGPT在执行重要操作之前会请求权限,用户可以随时中断、控制浏览器或停止任务。用户也可以安排已完成的任务自动重复,比如每周一早上生成每周报告。

在“人类最后一次考试”评估中,ChatGPT agent模型的SOTA(State of the arts,领域内最高水准)得分达到了41.6,当采用简单的并行部署策略(一次最多运行八次尝试,并选择自评置信度最高的一次)进行扩展时,得分提升至44.4。

此外,在FrontierMath等基准测试中,ChatGPT Agent的准确率也远超之前的模型。

Pro、Plus和Team用户可以使用Agent模式。企业版和教育版用户将在未来几周内获得访问权限。目前Pro用户每月有400次使用次数,其他付费用户每月有40次使用次数,也可以付费获得更多使用量。

相关内容

热门资讯

2026年春运明日开启 铁路、... 转自:央视新闻  明天零点,2026年全国春运正式启动,交通部门提前准备,应对未来40天95亿人次的...
钓鱼岛执法画面!首次披露   “那一年,  中国划出了十二海里的领海,  不是因为别人允许,  而是因为我们依法治海……”  ...
独龙江乡灾后重生 安居梦圆 转自:人民日报海外版  2025年5月31日,受强降雨影响,独龙江乡遭遇了“5·31”特大自然灾害。...
持续脱发别轻视!医生提醒或是身... 转自:新华社  冬春交替之际,气温波动较大,人体新陈代谢进入调整期,部分人群出现脱发增多现象。医生提...