擎朗智能CTO唐旋来:让服务机器人更好地陪伴人、服务人,让人们的生活变更好丨AI Partner·2024具身智能大会
2024-10-10 / 阅读约11分钟
来源:36kr
大模型和具身智能的发展,让机器人在复杂环境中能实现自主决策、闭环操作,赋予机器人思考和执行的能力。在餐饮、酒店等大规模商业化场景中,采用“移动底盘+机械臂”架构的具身智能机器人,将更具产品化能力,能够在成熟应用场景中承担更多复杂任务。

具身智能作为AI技术的重要分支,正逐步从抽象理论迈向物理现实,实现了物理世界与数字世界彼此的感知与链接,让AI在物理世界中有所作为。36氪长期专注探讨AI领域的产业革命和创新趋势,针对具身智能领域的突破性变革,以“让AI通向物理世界”为主题,邀请了重磅研究学者和企业嘉宾,共同见证人工智能技术从数字世界走向物理世界。

2024年9月26日-27日,为期两日的「2024具身智能大会」在上海盛大召开。大会以具身智能为核心,构建了从认知-发展-应用-未来为内容的议题体系,来自工程院、人工智能研究院等专家学者及业内从业者,以及来自知名科技巨头公司的行业大咖嘉宾,共同深入探究了具身智能技术对千行百业的重塑,并研判具身智能在商业领域应用潜力。同时,大会首日隆重发布36 氪「2024 具身智能创新应用案例」,为更多企业在该领域的发展应用提供宝贵参考,助推具身智能产业蓬勃发展。本次大会还特设「具身智能案例路演show」环节,诸多行业优质企业集体亮相,立体展示了具身智能行业的蓬勃新生力量。

在大会“具身智能在千行百业的应用场景落地”环节,擎朗智能CTO唐旋来发表了以“具身智能服务机器人的产业化探索与实践“为主题的演讲。他认为移动服务机器人在商用服务场景运行下的挑战有三点,一是非结构化复杂环境。在商用服务环境中,机器人所处的运行环境是持续变化的。环境布局和里面的人流量都是动态变化的,这就要求服务机器人提升自身的智能性,去适应环境的变化。二是完全开放的环境。商用服务行业是完全开放的,机器人与人是处在一个共同环境中的,需要跟人形成高度自由博弈, 来安全高效完成任务。三是机器人执行任务时需要完成整个流程的闭环,需要像人一样完成很多复杂的任务。

唐旋来还认为,在具身智能服用机器人的产业化落地及普及过程中,应用大模型和具身智能技术可以带来两点基础能力的提升。第一,大模型带来了更加泛化的推理能力,让机器人具备更强大的大脑和学习能力;第二,随着VLA、机械臂、运动控制技术等的快速发展,机器人可以具备更强的身体、运动和操作能力。擎朗智能的判断是在商用服务场景,移动底盘+机械臂的技术方案是具身智能商用服务机器人目前最有可能率先产品化的形态架构。

目前,擎朗智能的业务覆盖全球600多个城市及地区,海外营收占比超过50%。在海外特殊环境场景下,擎朗智能为酒店机器人增加双臂,通过模型训练让它学习抓取、按电梯等等,来完成服务流程闭环。客户不需要对酒店环境做任何改造,擎朗服务机器人均可以快速提供服务。此外,在快餐行业的应用场景中,擎朗智能通过具身智能训练,让擎朗服务机器人可以自主学习如何收集和回收餐具,减轻服务员的工作负担。

总的来说,擎朗智能是希望做到让服务机器人更好地陪伴人、服务人,让人们的生活变更好。

以下为演讲实录,经36氪编辑整理:

大家好,我来自擎朗智能的产研负责人,今天将结合大模型、人形机器人、具身智能,从技术发展和产业落地的角度来分享我们在具身智能服务业怎样落地,怎样做商业化。

擎朗智能十多年来一直在致力于推动商用服务机器人的普及。我们的愿景是致力于在2050年构建一个拥有“100亿零1台”机器人的世界。根据联合国预测,2050年全球人口将达到100亿,而我们希望做到比这个人口数量再多1台。

首先,我们来谈一谈做商用服务场景。商用服务场景就是我们日常生活的场景,比如餐厅,酒店,商场,医院等。这样的场景具备什么样的特点,对机器人有什么样的挑战呢?我们认为,在商用服务场景运行的移动服务机器人需要面临以下三个挑战:

1.非结构化复杂环境

在商用服务环境中,机器人所处的运行环境是持续变化的。这个变化体现在空间和时间两个维度, 从空间上来说,不同的商用服务场所,环境的差异很大, 比如不同类型的餐厅、不同地区的餐厅,它们的布局和环境差异很大; 从时间上来说, 商用环境的内部布局是不断在动态变化的,不同时间的人流情况会变,这往往是无法预测的一些变化。这就要求服务机器人提升自身的智能性,去适应和应对环境的不断变化,因为你不可能去改变外部环境。

2.完全开放的环境

商用服务行业是完全开放的,机器人与人是处在一个共同环境中的。目前机器人与人之间并没有明确的交互规则,这就会极其考验机器人的智能水平。我们来做个对比:自动驾驶汽车在高速上可以依赖车道线、红绿灯、斑马线等规则来导航;可服务机器人却在完全自由的状态下与人互动,没有任何规则,是跟人之间的高度自由博弈。比如,当一个人在侧面挨着机器人运行时,机器人就需要去预判这个人的意图,他也许下一步横穿到你面前,也许一直跟着你走,也许下一步就走开了,这个时候怎么解决问题?保险起见,跑慢一点比较安全,但比如,餐厅用餐高峰期,一方面用餐需求增高,希望机器人的配送速度要快一些,但也由于人流量增多,也需要机器人保证安全。又要跑得快又要跑得安全,这就处于机器人不断需要跟人群博弈的过程。

3.全流程闭环

机器人执行任务时需要完成整个流程的闭环。比如在餐厅中,配送不仅仅是从厨房到桌边的简单过程,而是包括了从厨房到送餐桌的全流程。对于酒店服务机器人来说,它需要能够自主搭乘电梯、通知顾客,并完成配送任务。这个闭环需要持续的信息交互和决策,才能形成完整的服务闭环流程。

擎朗智能CTO唐旋来

如今,擎朗已经构建了完整的技术链路,自研从感知、决策到执行的具身智能全链路技术。

我们在这里面看到的具身智能机器人的技术框架,它跟人是非常类似的,包含感知,执行,决策三个部分。首先它必须要有感知,相当于我们的五官,怎样从各个维度识别环境的信息,这是多模态的,你的模态越多,拿到的信息越完备。第二是我们需要思考决策,拿到信息以后怎样处理、过滤,然后形成思考框架,做出决策;最终是执行,执行就是机器人躯体的控制与运动体系决策。

值得一提的是,与目前大模型和自动驾驶技术相比,因为网络等基础设施的原因,商用服务机器人在很多场景中无法依赖强大的后台算力,特别是在海外市场,在脱离网络和后台的情况下,如何在复杂环境中继续做智能决策,这往往需要机器人依赖自身的决策来进行判断。

擎朗智能在服务机器人行业做了14年,也一直在思考,在大模型、人形机器人技术兴起的过程中,我们该如何应用大模型和具身智能技术,助力推进具身智能服用机器人的产业化落地及普及。目前我们总结下来在商用服务场景,服务机器人需要以下几个方面的提升:

1. 环境的适应性需提高。因为全球的商用服务场景太多,差异性也太大,而且商用服务环境变化太频繁,机器人需要更多模态的感知和数据,才能够快速去适应这个不断变化的复杂环境。

2. 机器人如何在复杂环境中提高执行任务的效率,比如配送机器人在用餐高峰期时,环境更拥挤,但需要它配送得更快。

3. 机器人与人的交互能力提升,比如语音、动作等一系列的多模态交互。举个例子,我们在海外的时候,有一个问题是机器人与人语音交互时,怎样自由切换语种。比如说第一个客人说的英语,下一个客人说的却是德语。

4. 关于物理操作方面,轮式机器人往往缺乏手或臂的操作能力,在端到端的服务闭环上还有所欠缺,我们需要作出相应的改善和迭代。

所以大模型和具身智能的发展带来两点基础能力的提升:

第一,具身智能大脑:大模型带来了更加泛化的推理能力,让机器人具备更强大的大脑和学习能力。通过大量的学习和训练,会让机器人对环境感知,任务理解,任务拆解等层面有更强的理解和推理能力;

第二,具身智能小脑:随着VLA技术,机械臂技术,运动控制技术的快速发展,让机器人具备更强的身体,有更强的运动和操作能力,这样就可以像人一样去完成很多复杂的任务。

结合在商用服务场景的大量移动机器人产品落地经验,我们认为在商用服务场景,移动底盘+机械臂的技术方案是具身智能商用服务机器人目前最有可能率先产品化的形态架构。擎朗已经落地了数万台的移动服务机器人,解决了轮式底盘在室内稳定运行的问题,当我们赋予机器人上肢后,通过大模型和具身智能的训练,我们可以让机器人做更多复杂的任务,创造更多价值。

擎朗智能的业务覆盖全球600多个城市及地区,并在阿联酋迪拜、德国、韩国、荷兰、加拿大、美国、日本、中国香港等地设有子公司/办公室,目前海外营收占比超过50%,但在海外市场的扩展过程中,挑战必不可少,比如,海外电梯改造的法规难题,比如我们在酒店的货柜搭配机器人,机器人怎样做到像人一样将货品取出来?

结合这些场景,我们为酒店机器人赋予双臂,通过模型训练让它学习抓取、按电梯等等,来完成服务流程闭环。这样,当这款机器人到达酒店的时候,客户不需要对酒店环境做任何改造,开箱即用,无论是国内还是海外,擎朗服务机器人都可以快速提供服务。

我们看这个视频,机器人像人一样按电梯,进出电梯,不需要对环境做任何改变。在这个过程中,机器人需要跟人一样,完全根据自身的感知和决策,去完成这个任务。机器人要进入这个电梯,它需要观察电梯的按钮在哪里,离自己有多远,怎么按;按完电梯之后,它需要观察电梯到没到,哪个电梯先到,电梯门什么时候开,机器人跟进出电梯的人怎么交互等。这一整套的流程都需要处理,当然还需要面对很多意外的情况,比如人把电梯门挡住了,或者人把机器挤住了,这些情境都需要机器人去判断并执行相应的处理动作。

此外,我们在与快餐行业合作时,发现机器人在收集餐盘的场景中也有巨大的潜力。通过具身智能训练,机器人可以自主学习如何收集和回收餐具,从而减轻服务员的工作负担。左边的视频是我们训练(如下图),大家可以看到我们通过遥控操作训练机器人,训练如何用机械臂将这些东西抓过来,然后去端起来这个餐具。我们想这一步完成之后,机器人就可以自己到桌边把这些东西收走,把盘子放到指定回收的地方。

对于未来,迈向人与机器人共存的世界,这是一个必然趋势,当然也充满惊喜与奇妙。无论是怎样的具身智能机器人,无论我们通过大模型赋予它怎样的思考能力,或者是赋予它像人一样灵活执行的能力。我们最终还是希望做到让服务机器人更好地陪伴人、服务人,让人们的生活变更好。这是我们这代AI机器人工作者渴望达成的目标。

简体中文 繁體中文 English 日本語 Deutsch 한국 사람 русский بالعربية TÜRKÇE português คนไทย Français