科技魔方

OpenAI发布首款AI智能体Operator:可控制浏览器自动完成购物、订餐等任务

OpenAI

2025年01月24日

  1月24日消息,OpenAI昨日发布首款AI智能体Operator,能够代理用户执行基于网页的操作。

  据悉,Operator向美国的Pro版订阅用户开放,后续将扩展到Plus、Team和Enterprise用户,并在未来将这些功能集成到ChatGPT中。

  据介绍,Operator由一个名为CUA的新模型驱动,结合了GPT-4o的视觉能力,以及通过强化学习实现的高级推理。

  经过训练后,Operator能够“看见”浏览器的内容,并使用鼠标和键盘允许的所有操作与网页进行互动。例如,在官方演示了让Operator预定饭店和去购物网站购物等案例。

  不过,OpenAI也提醒使用者,虽然Operator已经是市面上最强的AI代理,但与人类相比依然差得很远,所以这项新技术仍有可能犯错,但会在未来数月里持续改进。(萧健)

+1

来源:Techweb

延展资讯