OpenAI又发新品了,但这次不是语言模型,也不是更会聊天的新ChatGPT,而是一个全新的AI智能体。
当地时间1月23日,OpenAI发布Operator,这是一个可以上网为用户执行任务的智能体。用OpenAI的话说就是:“一种能够独立为你工作的AI——你给它任务,它为你执行。”
也就是说,相比于以往的ChatGPT,Operator突破了对话框的界限。从前ChatGPT不管有多少花样,本质上都是一个聊天机器人,通过对话给你出主意。而Operator则摆脱了束缚,可以直接“代劳”,替你做一些事。
用户对此兴奋不已,在OpenAI官宣该消息几个小时前,有Pro用户发现界面出现了Operator选项,疑似是此前传闻的智能体。在那之后,ChatGPT一度宕机,疑似是短时间涌入了大量用户。
这种兴奋在意料之中,毕竟一脚迈出对话框,可就完全是另一个层级的存在了。
不只有OpenAI在研究这种产品。就在OpenAI发布Operator的几乎同时,至少有两个同类型的产品出现。
一个是Perplexity推出的安卓版助手,这个应用程序有多模态交互体验和跨应用任务执行能力。
另一个是国内大模型公司智谱1月23日正式上线的电脑端智能体GLM-PC,时间上抢先OpenAI一步。顾名思义,这也是一个可以协助用户完成各类电脑任务的智能体。
更早些时,微软曾推出Copilot Actions,使用AI自动执行重复性任务。此外,在1月初,微软的研究团队推出了被称为“大型行动模型(Large Action Model,简称LAM)”的AI技术。
AI能做得更多了,替代人类的可能性是不是也更高了?这是一种很直接的顾虑。
在发布Operator之前,OpenAI CEO山姆·奥特曼(Sam Altman)自己就说:“我们相信,到 2025 年,我们可能会看到第一批 AI 代理“加入劳动力队伍”,并实质性地改变公司的产出。”
弗吉尼亚大学经济学教授安东·克里内克(Anton Korinek)甚至认为:“任何只能在电脑前完成的工作,在未来 24 个月内,都可以由人工智能代理完成。”
我们的第一批AI同事,已经被造出来了吗?
先来看看OpenAI的新品Operator。
操作是简单的——还是从对话框开始,用户选择可能会用到的网页(如电商网页、可以预订餐位的本地生活网页、旅行网页等),然后以自然语言描述任务,Operator就会在浏览器“动起来”,开始帮忙执行。
例如,在直播中,OpenAI现场演示,在Operator中选中OpenTable,然后输入“给我预订一张今晚7点Beretta餐厅的桌子。”Operator就会开始执行,打开OpenTable的网页,找到Beratta餐厅页面,选择时间和就餐人数。
执行过程以小窗口形式在对话框中显示,也可以选择最大化,此时Operator会缩到侧边栏。这样一来,用户可以看到Operator在浏览器里的所有行为,同时可以随时在对话框中输入新的指令。
如果在操作的时候,需要用户登录账号、支付等,Operator会向用户发起请求。此外,用户自己也可以随时接管。
从当地时间1月23日开始,位于美国的ChatGPT Pro用户可以使用Operator的“研究预览版”。奥特曼表示,这只是暂时的:未来会逐步拓展到更多地区,预计几个月之后,拓展到Plus用户。
从实际反馈来看,Operator的使用感受颇为不错。
知名AI博主、The Rundown AI的创始人Rowan Cheung在官宣之前就深度使用了一番,Operator的一些操作让他感觉很惊喜。当Operator执行任务时,指令中提到的某个网页打不开,它会自行找替代方法,选择使用搜索引擎检索;当任务比较复杂,Operator不断和Cheung确认偏好等,但执行流程始终持续未中断;Cheung想要得知的信息并不公开,Operator尝试了各种方法之后,检索到了一篇可靠的博文推荐给他;被“是否是人类”的验证挡住的时候,Operator向Cheung发起确认。
也就是说,Operator在执行任务时,“自主性”较高,会做各种尝试,并且连续性好,可以在过程中反复和用户协同并最终完成目标。
缺点当然也存在,格雷格·伊森博格(Greg Isenberg)是硅谷小有名气的连续创业者,在X上有42万粉丝。他使用Operator之后总结,Operator有时会在执行复杂任务时卡住,并且目前有每天的使用次数限制。
平心而论,同样的任务交给一个人类帮忙,可能丝滑程度比不上Operator。
了解了Operator的功能以及表现,就不难理解为什么ChatGPT会被汹涌而来的流量“挤爆”了。在对话框中的ChatGPT已经掀起AI巨浪,也切实地给很多人的生活带来了极大的帮助,走出对话框,想象空间变得更加广阔。
对Operator,OpenAI的定调也很高。
Operator推出之际,奥特曼在直播中表示,Operator的发布意味着OpenAI进入Level 3。OpenAI将AI到AGI(通用人工智能)的过程分为五个level(等级):聊天机器人Chatbots、推理者Reasoners、智能体Agents、创新者Innovators、组织Organizations。
而OpenAI的首席产品官Kevin Weil近期在达沃斯世界经济论坛上说:“我认为 2025 年将是智能代理真正实现的一年,我们将从现在的状态迈入一个新的阶段。”
图注:OpenAI首席产品官Kevin Weil(右)正在接受《华尔街日报》采访
正在促成“2025年智能体真正实现”的,不止有OpenAI,众多AI厂商已经入局。
最明显的一个信号,是Perplexity几乎在同一时间推出了安卓版“Perplexity Assistant”,也是走出对话框、可以直接执行任务的工具。使用这个应用程序,用户可以基于屏幕提问,或者用摄像头让其基于现实世界互动。除此之外,它也可以写邮件、设置提醒、订餐、叫车等。这涉及调用其他软件,目前已经支持的第三方软件有Spotify、YouTube、Uber等。
在国内,智谱也发布了电脑智能体GLM-PC,就在OpenAI发布Operator的前一天,与此同时还宣布了移动端AutoGLM的最新升级。在智谱开放日上,CEO张鹏现场演示,掏出手机说了几句话,观众就收到了红包。
往前稍加回溯,智能体已经频繁被推出。
微软有操作系统的加持,在深度集成的Copilot AI中展开各种尝试。如去年10月,微软一口气推出10款AI代理,自主执行特定任务。谷歌则在去年12月官宣Project Mariner,和OpenAI的Operator很相似,也是一个可以代理控制浏览器的智能体。彼时,谷歌还同步推出了帮助探索复杂内容的Deep Research、帮助完成编码任务的Jules。
早在2023年12月,比尔·盖茨就已经做出了预言,发布名为《AI将彻底改变你使用计算机的方式(并颠覆软件行业)》的文章。
如今,研究机构Gartner把AI代理列为2025年十大技术趋势之一。“AI代理”一词,成了科技界名流们挂在嘴边的词。
普通用户们,在指示AI代理帮忙点了个外卖的同时,也一定会想到一个问题:AI都能直接执行任务了,离替代我工作还有多远?
发布AI代理的公司其实也早已盯上了企业用户(也就是打工人们的老板)。
奥特曼在本月初发表了一篇博文,其中写道:“我们相信,到 2025 年,我们可能会看到第一批人工智能代理‘加入劳动力大军’,并从根本上改变公司的产出。”
“并从根本上改变公司的产出”在企业主听来是成本降低、效率提升,在打工人听来则是“失业”的脚步在靠近。
这是不难猜到的走向,困在对话框和个人用户中的聊天机器人,也困在盈利难题中。奥特曼在一次采访中就表示,目前给Plus用户背后的成本超过每月20美元的订阅费用,Pro用户背后的成本也超过200美元。
一方面,OpenAI们期待通过规模化效应削薄成本。这需要投入大量的财力,且并非一蹴而就,OpenAI在扩大算力方面的最新努力,是与甲骨文、软银合资建立星际之门公司,宣称投入金额会达到5000亿美元。
另一方面,就是拓宽赛道,在“给用户提供订阅服务”之外寻求更广阔的盈利天地。
微软、Salesforce、ServiceNow、Workday等公司在去年都推出了AI代理,而且在宣传时强调可以帮助企业在招聘员工、联系潜在销售线索、创建营销和管理信息技术等方面更加省心。
《华尔街日报》在近期的报道中,援引一些企业的技术高管称,这意味着可以减少员工工作时长,甚至减少招聘新员工。
研究机构Gartner预测,到 2028 年,至少 15% 的日常业务决策将通过代理人工智能自主做出,而 2024 年这一比例为 0%。但到那时,25% 的企业违规行为也将与人工智能代理滥用有关。
实际上,已经有不少企业先“吃螃蟹”。
穆迪公司的很多研究工作,如行业比较或查看公司提交给美国证券交易委员会的文件等,过去是外包给美国之外人工成本相对较低的地区,但现在开始利用AI代理来完成。
eBay则使用AI代理来帮助编写代码和开展营销活动,并计划推出能帮用户寻找商品、帮卖家展示商品的代理。
的确,目前的AI代理还需要在人类的协作下完成任务。但未来真的远吗?还记得3年前,我们还没有ChatGPT、豆包、文心一言,Siri蠢得像人工智障,如今它们已经是很多人工作流中不可舍弃的一部分。
弗吉尼亚大学经济学教授科里内克在接受Axios采访时表示,虽然仍然需要人类来监督人工智能的工作,但代理将在未来两年内开始取代人类:“任何只能在电脑前完成的工作,在未来 24 个月内,都可以由人工智能代理完成。”
图源: AI制作
此外,他还透露:“从我与商业领袖的对话中得知,大多数雇用白领的大公司都在研究如何利用AI来实现自动化。”
甚至于,麦肯锡高级合伙人兼AI专家 Lareina Yee认为,公司必须想办法调整运营以适应人工智能员工。将AI代理引入工作场所的最大挑战不是技术,而是人:“这不是一个技术战略时刻,而是一个商业战略时刻。”
打工人们能做的,恐怕只有尽量赶上时代,熟悉最新的AI趋势,尽量用其提高工作表现。很快,当我们在职场上谈到一个人的“可替代性”高不高时,将不再是指被另一个人类替代。