超越Siri与Alexa,AI代理引领数字助手新纪元
1 周前 / 阅读约11分钟
来源:CNET
AI代理技术作为下一代人工智能技术,旨在通过个性化建议和推荐改变设备使用方式。芯片制造商如高通、联发科已在其未来功能预测中纳入AI代理。该技术目前主要应用于高端智能手机,预计将逐步普及至更便宜设备。AI代理将集成到汽车中,但手机仍将是AI体验的中心。

Getty Image/Zooey Liao/CNET

如今,市场上的尖端手机正通过引入全新的生成式AI功能,承诺让生活变得更加便捷,这些功能包括文本撰写、基于提示的图像创作,以及从照片中移除不需要的元素。随着各大企业开始大肆宣传所谓的代理式AI——即能够精准满足用户需求的AI代理,科技行业已将目光投向了下一代人工智能。这些AI代理将通过提供创新的建议、推荐及其他方式,真正提升用户体验,从而彻底改变我们与设备的互动方式。

简而言之,手机及其他热门科技产品的制造商宣称,AI代理将是Siri等语音助手的升级版。它们能够从个人应用、数据以及网络搜索中获取输入,从而给出更加细致入微的答案。这是一种更为智能的AI,据称能够实现当前助手所无法达成的诸多承诺,如预测需求、理解复杂问题等。

高通、联发科等公司一直在其未来功能预测中公开提及AI代理。这些芯片制造商在介绍即将应用于高端Android手机的顶级处理器时,均提到了这项技术。

“当我们谈及针对个人设备的代理及由[生成式]AI驱动的代理时,我们实际上是在谈论一种能够根据您的需求进行情境化处理的软件。它能在您个人的操作情境中为您提供建议——无论是日常生活、日历安排还是其他需求,”麦肯锡公司的高级合伙人兼分析师拉里·哈马莱宁解释道。

哈马莱宁指出,AI代理肩负着一项使命:“我们如何自动化流程,为人们的生活带来便利?”

生成式AI于去年年底首次亮相于高端智能手机,谷歌Pixel 8系列手机率先采用,随后是三星Galaxy S24系列,最后是iPhone 15和iPhone 16中的Apple Intelligence。根据IDC最近的报告,未来几年内,生成式AI功能预计将逐渐普及至更廉价的设备,预计到2028年,约有70%的手机将配备这一功能。然而,分析师甚至无法准确预测AI代理的出现时间。

在此期间,尽管谷歌的Gemini AI及其Project Astra项目(该项目可通过手机摄像头或智能眼镜识别物体)并未直接提及AI代理,但它们正在构建的功能似乎能够弥合当前AI与定义下一代AI的代理之间的差距。这家科技巨头最近与三星合作推出了下一代增强现实概念头显Project Moohan,该头显将AR与AI相结合,引导用户观察世界,并对他们正在观看的内容进行评论。谷歌在AI软件和硬件方面的持续创新,可能会缩小与AI代理之间的差距,让用户逐渐习惯于信任人工智能来处理各种查询和任务。

然而,目前AI代理仍只是公司急于搭上AI热潮的承诺和构想。对此持怀疑态度是合理的。虽然人们已开始将ChatGPT和Midjourney等AI工具融入家庭工作流程,但它们尚未广泛融入职场,更不用说人们的移动生活了。以下将探讨代理式AI如何在计算机和智能手机上进一步改变我们的日常生活。

David Lumb/CNET

AI代理:像人类助手一样数字化解决问题

作为即将面世的技术,AI代理尚无明确定义。但专家认为,这种先进的AI将超越Siri或Google Assistant,后两者在解决复杂请求时往往仅限于回答单个问题。AI代理甚至可能代表用户与其他AI代理进行谈判。与先前的生成式AI和5G技术相似,这一最新趋势尚未确定一个“杀手级应用”,以使其成为不可或缺的创新。

我首次听闻AI代理,是在联发科介绍其最新的天玑9400移动芯片时。该芯片内置了一个代理式AI引擎。这并不意味着搭载该芯片的手机将直接拥有AI代理,而是一个工具集,旨在帮助设备制造商和开发人员创建自己的AI代理和应用程序。开发人员可利用该技术增强应用内搜索功能,或使用个人数据预测用户行为及需求,甚至根据用户的日常安排提醒其采取行动。这是应用开发者在未来几年内集成或创建自身AI代理的初步步骤之一。

联发科的芯片制造竞争对手高通亦不甘落后。在毛伊岛举行的10月骁龙峰会上,该公司展示了AI代理将如何改变用户习惯。高通技术规划和边缘解决方案总经理杜尔加·马拉迪在峰会上表示,AI代理可在应用中搜索相关信息,根据用户的日程安排定制建议,甚至在用户提出请求之前便主动提供建议。

“我们正步入一个更加主动的计算时代,无处不在的AI将在后台持续运行,预测您的下一步行动,洞悉您接下来可能要做的事情,并在您甚至提出请求之前便提供解决方案,”马拉迪说道。

最终,高通认为这些AI代理将全面取代应用程序。用户只需提出问题,代理便会代为完成所有工作,为请求提供明确答案。“[应用程序]依然存在,但它们将在后台运行,”马拉迪于10月对CNET欧洲高级记者凯蒂·柯林斯表示。

这与分析师对未来几年的预期相契合,但同时也引发了关于AI能了解用户多少以便代表其采取行动的问题。Techsponential总裁兼首席分析师阿维·格林加特指出,信任AI代理处理金钱或安排日程等事务,不仅需要访问凭证,代理还需深入了解用户的偏好,以便做出用户认可的决策。用户需信任其AI。

“这不仅仅是一个技术问题,更是一个个人和文化问题,”格林加特说道。

在10月的骁龙峰会上,高通展示了其芯片如何为每位乘客(包括儿童)定制车内体验。凯蒂·柯林斯/CNET

未来汽车中的移动AI代理

尽管生成式AI最近才在消费类小工具中普及,但大型科技公司已在AI汽车技术上投资多年。汽车AI的终极目标仍是自动驾驶技术,尤其是随着自动驾驶出租车涌入旧金山等城市街道。然而,目前一些科技公司正探索如何将AI代理与汽车相结合。

高通在骁龙峰会上推出了两款专注于汽车的芯片,并宣布梅赛德斯-奔驰和理想汽车将在未来车型中使用这些芯片。该芯片制造商阐述了其芯片如何助力提升车载生活功能,利用神经处理单元处理未来汽车中大量传感器的数据——这不仅包括扫描车辆外部道路的传感器,还包括可追踪用户动作的车内传感器。若您说:“摇下车窗”,并指向车窗,汽车理应照做。

但最终,高通认为AI代理也将进入汽车领域,以增强这些体验。基于汽车的芯片具备更强大的处理能力,能够与驾驶员的设备网络同步并扩展其功能,提供更为复杂的解决方案。高通高管马拉迪举了一个假设性例子:在开车回家的路上,您可能会要求代理预订晚餐,代理会综合考虑您所有的本地偏好。

“[代理]会回应说:‘这是我找到的预订信息,顺便一提,您虽未明确要求,但我会为您朗读,因为您正驾车前往那家餐厅,并且已给您妻子发送短信,告知她在那里会面,’”马拉迪在骁龙峰会上说道,强调了从响应式AI到进行推断并采取行动的AI之间的差异。“在此情境下,代理正在预测您下一个可能的问题。”

分析师哈马莱宁表示,对于汽车可能成为AI代理功能中心的观点,最好持谨慎态度。抛开高通和汽车公司在宣传AI汽车体验方面的自身利益不谈,人们在汽车上花费的时间并不足以证明其中心地位,且对于数百万没有汽车的人来说,公司很难将AI的中心地位作为依托。

“非常真实的是,汽车是一种极其重要和中心的设备和资产,其中将包含大量的AI计算。但我不认为它会与个人代理体验紧密相关,”哈马莱宁说道。

他以苹果为例,说明了一家可以依靠iPhone作为AI体验中心的公司。“大多数人并不像那样与他们的汽车紧密相连。他们与手机的联系更为紧密,因为手机总是随身携带。而汽车则不然,”哈马莱宁补充道。

Oscar Wong/Getty Images

AI代理对手机使用方式的影响

尽管生成式AI正逐步融入手机,但其应用已分散至文本生成、改进Siri和语音助手响应、扩展图像边界及其他照片编辑功能等不同的用例中。公司做出的广泛承诺,以及我们对如何在现实生活中使用手机生成式AI的构想,尚未完全实现。

随着CNET的持续预测,我们转向AI代理可能具备的功能:更大、更令人兴奋的应用,助力用户完成更复杂的任务。处理紧急任务、根据个人偏好制定行程、发送提醒以保持日程安排有序,是我们认为AI代理能在日常生活中助力手机用户的几种方式。

然而,关于AI代理何时能进入主流市场,目前尚无共识。实现这项技术面临一些技术障碍,从改进移动芯片到完善大型语言模型以产生连贯的输出。更重要的是,哈马莱宁指出,为使AI代理在每个人的手机上都能运行,还需解决规模问题。OpenAI每天处理大量ChatGPT请求是一回事,但满足每年向数百万用户发货、且用户始终在使用的数百万部手机对AI的需求,则是另一回事。

“[手机]使用是持续的。当您使用手机时,每天大约会使用五个小时,对吧?因此要求很高,”他说道。“像OpenAI或拥有CoPilot的微软这样的公司,无需一直处理那种即时的需求水平。”

在骁龙峰会上,高通对增强现实与未来AI代理的结合持乐观态度,特别是协调AR眼镜所看到的内容与用户问题。鉴于这一小工具领域尚处于起步阶段,雷朋Meta智能眼镜是目前唯一的主流型号,因此可能需要一段时间,包括手势控制(如Apple Vision Pro)在内的这类界面才会普及。

谷歌的Project Astra项目正致力于将AI与视觉界面相融合,尽管目前该项目仍处于测试阶段,但它预示着眼镜硬件领域或将迎来全新的软件解决方案。分析师预测,消费者可能会更快地适应另一种界面形式:即更加依赖语音控制。对于Alexa用户和拥有Google Assistant控制的智能家居的用户而言,这种与智能小工具交互的方式早已习以为常,尤其在双手忙碌时或作为辅助工具使用时,其便捷性尤为突出。而消费者之所以会欣然接受这一变化,更深层次的原因在于,随着技术巨头不断升级Siri及其他语音助手,这些技术已经在我们口袋中的设备上悄然运行,并通过无线耳机为我们提供服务。

或许,迈向AI代理的未来之路,正意味着我们需要摒弃今天所熟知的触屏手机体验。

“我认为我们将见证的是,设备体验也将实现高度自动化,用户只需通过语音命令即可轻松操控手机,”哈马莱宁表示,“我预计,许多如今通过[点击]手指完成的操作都将实现自动化。”