OpenAI首个AI智能体Operator亮相:可像人一样浏览网页、打字、购物

三言科技1月24日消息,日前,OpenAI发布了其首款AI智能体Operator,该智能体能够帮助用户执行基于网页的操作,即像人类一样使用网页浏览器。

500

500

OpenAI的演示中,Operator可以精确理解各种指令,并能自主完成各类任务,例如可以直接与网页交互,包括打字、点击、滚动等;还能够自动填写在线表单、上网购物、创建表情包、处理重复性浏览器任务等。

山姆·奥特曼表示,自1月23日起,美国ChatGPT Pro用户将能使用“预览版”Operator;未来该智能体将拓展至更多区域的Pro用户,几个月后ChatGPT Plus也开放使用。

500

据OpenAI官网介绍,Operator由CUA(Computer-Using
Agent)的新模型驱动,结合了GPT-4o的视觉能力,并通过强化学习实现高级推理。这使得Operator能够“看见”网页,并使用鼠标和键盘与网页互动。模型在遇到困难时会调用推理能力自我纠正,若依然无法解决问题则会将控制权交还给用户。

站务

最近更新的专栏

全部专栏