AI代理:未来已来,定义何在?
1 周前 / 阅读约7分钟
来源:TechCrunch
AI代理被描述为能执行人类客服、HR或IT员工过去所做任务的AI软件,虽无准确定义,但旨在以最少人工干预自动完成任务。多家科技公司和专家对AI代理的看法各异,认为其发展需克服技术挑战,构建专门的基础设施。

图片来源:girafchik123 / Getty Images

AI代理本应成为人工智能领域的下一个明星产品,但目前尚缺乏一个公认的精确定义。各方对于AI代理的具体含义仍未达成共识。

简而言之,AI代理可被视为一种由人工智能驱动的软件,能够执行以往可能由人类客服、人力资源或IT支持人员完成的多种任务。用户只需发出指令,它便能执行,有时甚至能跨越多个系统,远远超出了简单回答问题的范畴。例如,上月Perplexity公司推出的AI代理便助力节日购物(且非唯一一款)。上周,谷歌也宣布了其首款AI代理——Project Mariner,可用于查找航班和酒店信息、购买家居用品、搜索食谱等。

听起来简单,对吗?然而,由于缺乏明确定义,情况变得复杂。即便在科技巨头之间,也未能达成一致。谷歌将AI代理视为基于任务的助手,根据工作类型不同,可为开发人员提供编码帮助,为营销人员创建配色方案,或通过分析日志数据协助IT人员追踪问题。

对于Asana而言,代理或许就像一个额外的员工,能像任何优秀同事一样处理分配的任务。由前Salesforce联合首席执行官Bret Taylor和谷歌老员工Clay Bavor创立的Sierra初创公司,则将代理视为提升客户体验的工具,能完成远超传统聊天机器人的复杂任务,解决更广泛的问题集。

尽管缺乏统一定义,人们对这些代理的能力感到困惑,但无论如何界定,这些代理的目标均在于以最少的人工干预自动完成任务。

Glasswing Ventures的创始人兼管理合伙人Rudina Seseri表示,目前仍处于早期阶段,这可能是缺乏共识的原因。“关于‘AI代理’的定义并不统一。但最常见的观点是,代理是一种智能软件系统,旨在感知环境、进行推理、做出决策并采取行动,以实现特定目标,”Seseri向TechCrunch透露。

她表示,这些系统运用了多种AI/ML技术,如自然语言处理、机器学习和计算机视觉,以在动态环境中自主运行或与其他代理及人类用户协同工作。

Box公司联合创始人兼首席执行官Aaron Levie认为,随着AI日益强大,AI代理将能代表人类完成更多任务,且已有一些动态因素推动此趋势。

“AI代理拥有一个自我强化的飞轮,由多个组件构成,将极大改善AI代理在短期和长期内所能完成的任务:GPU的价格/性能、模型效率、模型质量和智能、AI框架和基础设施改进,”Levie最近在领英上写道。

这是对技术的一种乐观展望,假设这些领域均将增长,但这并非必然。麻省理工学院机器人技术先驱Rodney Brooks在近期接受TechCrunch采访时指出,AI需解决比多数技术更棘手的问题,且其增长速度未必与摩尔定律下的芯片增速相同。

“当人类目睹AI系统执行任务时,他们会立即将其推广至类似任务,并评估AI系统的能力;不仅关注那次表现,更围绕那次表现评估其潜力,”Brooks在采访中说道。“但他们通常过于乐观,因为他们采用了人类在任务上的表现模型。”

跨系统操作颇具挑战,且部分遗留系统缺乏基本API访问权限,进一步加剧了问题复杂性。尽管我们正见证Levie所提及的稳步改进,但让软件能够访问多个系统并解决过程中可能遇到的问题,或许比许多人想象的要更具挑战性。

若果真如此,或许每个人都高估了AI代理的潜力。HFS Research研究主管David Cushman认为,当前的机器人群体更像Asana所做的那样:作为助手协助人类完成某些任务,以实现特定的用户定义战略目标。挑战在于帮助机器以真正自动化的方式处理意外情况,而我们显然还远未达到这一目标。

“我认为这是下一步,”他表示。“这是AI在大规模上独立且有效运行的阶段。因此,这是人类设定准则、界限,并应用多种技术将人类从循环中解脱出来的阶段——而过去一切均旨在保持人工智能与人类的联系。”关键在于让AI代理接管并实现真正自动化。

Madrona Ventures合伙人Jon Turow表示,这将需要构建一个AI代理基础设施,一个专为创建代理(无论您如何定义它们)而设计的技术堆栈。在最近的博客文章中,Turow概述了当前在野外工作的AI代理示例及其构建方式。

在Turow看来,随着AI代理日益普及——他也承认这一定义仍略显模糊——需要像其他技术一样构建技术堆栈。“这均意味着我们的行业必须努力构建支持AI代理及其依赖的应用程序的基础设施,”他在文章中写道。

“随着时间推移,推理将逐步改进,前沿模型将引导更多工作流程,开发人员将专注于产品和数据——这是他们的独特之处。他们希望底层平台能够‘正常工作’,具备规模、性能和可靠性。”

还需注意,可能需要多个模型而非单一LLM才能使代理运作,若将这些代理视为不同任务的集合,则此观点合理。“我认为目前尚无任何单一、至少公开可用的整体大型语言模型能够处理代理任务。我认为它们尚不能进行多步骤推理,这真让我对代理的未来充满期待。我认为我们离此目标越来越近,但尚未达成,”Macquarie US Equity Research美国AI和软件研究主管Fred Havemeyer表示。

“我认为最有效的代理可能是多个不同模型的集合,以及一个路由层,该层将请求或提示发送至最有效的代理和模型。我认为这将像一个有趣的[自动化]监督者,分配特定角色。”

最终,对于Havemeyer而言,该行业正朝着代理独立运行的目标努力。“当我思考代理的未来时,我期待看到真正自主的代理,能够接收抽象目标,然后完全独立地推理出所有中间步骤,”他向TechCrunch透露。

但事实是,我们仍处于这些代理的过渡期,不知何时能达到Havemeyer所描述的最终状态。尽管我们目前所见显然是朝着正确方向迈出的希望之步,但仍需一些进步和突破,方能使AI代理如今天所设想般运作。重要的是要理解,我们尚未达到那个阶段。

本文最初发布于2024年7月13日,并已更新以包含Perplexity和谷歌的新代理信息。

简体中文 繁體中文 English 日本語 Deutsch 한국 사람 русский بالعربية TÜRKÇE português คนไทย Français