AI代理：未来已来，定义何在？ - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

AI代理：未来已来，定义何在？

2024-12-15 / 阅读约7分钟

来源：TechCrunch

AI代理被描述为能执行人类客服、HR或IT员工过去所做任务的AI软件，虽无准确定义，但旨在以最少人工干预自动完成任务。多家科技公司和专家对AI代理的看法各异，认为其发展需克服技术挑战，构建专门的基础设施。

图片来源：girafchik123 / Getty Images

AI代理本应成为人工智能领域的下一个明星产品，但目前尚缺乏一个公认的精确定义。各方对于AI代理的具体含义仍未达成共识。

简而言之，AI代理可被视为一种由人工智能驱动的软件，能够执行以往可能由人类客服、人力资源或IT支持人员完成的多种任务。用户只需发出指令，它便能执行，有时甚至能跨越多个系统，远远超出了简单回答问题的范畴。例如，上月Perplexity公司推出的AI代理便助力节日购物（且非唯一一款）。上周，谷歌也宣布了其首款AI代理——Project Mariner，可用于查找航班和酒店信息、购买家居用品、搜索食谱等。

听起来简单，对吗？然而，由于缺乏明确定义，情况变得复杂。即便在科技巨头之间，也未能达成一致。谷歌将AI代理视为基于任务的助手，根据工作类型不同，可为开发人员提供编码帮助，为营销人员创建配色方案，或通过分析日志数据协助IT人员追踪问题。

对于Asana而言，代理或许就像一个额外的员工，能像任何优秀同事一样处理分配的任务。由前Salesforce联合首席执行官Bret Taylor和谷歌老员工Clay Bavor创立的Sierra初创公司，则将代理视为提升客户体验的工具，能完成远超传统聊天机器人的复杂任务，解决更广泛的问题集。

尽管缺乏统一定义，人们对这些代理的能力感到困惑，但无论如何界定，这些代理的目标均在于以最少的人工干预自动完成任务。

Glasswing Ventures的创始人兼管理合伙人Rudina Seseri表示，目前仍处于早期阶段，这可能是缺乏共识的原因。“关于‘AI代理’的定义并不统一。但最常见的观点是，代理是一种智能软件系统，旨在感知环境、进行推理、做出决策并采取行动，以实现特定目标，”Seseri向TechCrunch透露。

她表示，这些系统运用了多种AI/ML技术，如自然语言处理、机器学习和计算机视觉，以在动态环境中自主运行或与其他代理及人类用户协同工作。

Box公司联合创始人兼首席执行官Aaron Levie认为，随着AI日益强大，AI代理将能代表人类完成更多任务，且已有一些动态因素推动此趋势。

“AI代理拥有一个自我强化的飞轮，由多个组件构成，将极大改善AI代理在短期和长期内所能完成的任务：GPU的价格/性能、模型效率、模型质量和智能、AI框架和基础设施改进，”Levie最近在领英上写道。

这是对技术的一种乐观展望，假设这些领域均将增长，但这并非必然。麻省理工学院机器人技术先驱Rodney Brooks在近期接受TechCrunch采访时指出，AI需解决比多数技术更棘手的问题，且其增长速度未必与摩尔定律下的芯片增速相同。

“当人类目睹AI系统执行任务时，他们会立即将其推广至类似任务，并评估AI系统的能力；不仅关注那次表现，更围绕那次表现评估其潜力，”Brooks在采访中说道。“但他们通常过于乐观，因为他们采用了人类在任务上的表现模型。”

跨系统操作颇具挑战，且部分遗留系统缺乏基本API访问权限，进一步加剧了问题复杂性。尽管我们正见证Levie所提及的稳步改进，但让软件能够访问多个系统并解决过程中可能遇到的问题，或许比许多人想象的要更具挑战性。

若果真如此，或许每个人都高估了AI代理的潜力。HFS Research研究主管David Cushman认为，当前的机器人群体更像Asana所做的那样：作为助手协助人类完成某些任务，以实现特定的用户定义战略目标。挑战在于帮助机器以真正自动化的方式处理意外情况，而我们显然还远未达到这一目标。

“我认为这是下一步，”他表示。“这是AI在大规模上独立且有效运行的阶段。因此，这是人类设定准则、界限，并应用多种技术将人类从循环中解脱出来的阶段——而过去一切均旨在保持人工智能与人类的联系。”关键在于让AI代理接管并实现真正自动化。

Madrona Ventures合伙人Jon Turow表示，这将需要构建一个AI代理基础设施，一个专为创建代理（无论您如何定义它们）而设计的技术堆栈。在最近的博客文章中，Turow概述了当前在野外工作的AI代理示例及其构建方式。

在Turow看来，随着AI代理日益普及——他也承认这一定义仍略显模糊——需要像其他技术一样构建技术堆栈。“这均意味着我们的行业必须努力构建支持AI代理及其依赖的应用程序的基础设施，”他在文章中写道。

“随着时间推移，推理将逐步改进，前沿模型将引导更多工作流程，开发人员将专注于产品和数据——这是他们的独特之处。他们希望底层平台能够‘正常工作’，具备规模、性能和可靠性。”

还需注意，可能需要多个模型而非单一LLM才能使代理运作，若将这些代理视为不同任务的集合，则此观点合理。“我认为目前尚无任何单一、至少公开可用的整体大型语言模型能够处理代理任务。我认为它们尚不能进行多步骤推理，这真让我对代理的未来充满期待。我认为我们离此目标越来越近，但尚未达成，”Macquarie US Equity Research美国AI和软件研究主管Fred Havemeyer表示。

“我认为最有效的代理可能是多个不同模型的集合，以及一个路由层，该层将请求或提示发送至最有效的代理和模型。我认为这将像一个有趣的[自动化]监督者，分配特定角色。”

最终，对于Havemeyer而言，该行业正朝着代理独立运行的目标努力。“当我思考代理的未来时，我期待看到真正自主的代理，能够接收抽象目标，然后完全独立地推理出所有中间步骤，”他向TechCrunch透露。

但事实是，我们仍处于这些代理的过渡期，不知何时能达到Havemeyer所描述的最终状态。尽管我们目前所见显然是朝着正确方向迈出的希望之步，但仍需一些进步和突破，方能使AI代理如今天所设想般运作。重要的是要理解，我们尚未达到那个阶段。

本文最初发布于2024年7月13日，并已更新以包含Perplexity和谷歌的新代理信息。

上一篇：黄仁勋为AI奔走

下一篇：微信封禁利用AI仿冒知名人士进行营销宣传的209个账号

返回列表

热文阅读

2 天前

寒武纪 2025 年第一季度营收 11.11 亿元同比增长 4230.22%，实现扭亏为盈

2 天前

中微尹志尧放弃美籍恢复中国籍！芯片公司IPO惊天造假:证监会罚近千万；陈立武精简英特尔团队；Q1小米出货飙升40%苹果下滑9%