在近期的2024 Inclusion·上海外滩大会上,Kevin Kelly对未来世界做出了新的假想:全球主义正在迅速推进,正在共同构建一个基于技术的“超级计算机”。每一台手机、笔记本电脑和数据服务器都将连接成一个巨大的计算系统,而每一台设备都是其中的一个小小的“神经元”。
“我们正在打造一个巨大的、全球性的、如行星般规模的机器。”他认为,尽管人们可能对设备和内容有不同的偏好,但这些差异只是交互方式上的不同,根本上它们都归属于同一个平台。世界上的所有数字技术,包括人工智能,都运行在这个新平台上。
如今,这台“超级计算机”正在以前所未有的规模和速度运行。这也驱动着创新加速,让新发明和新思想的传播速度越来越快。比如人们通过增强现实和虚拟现实技术来培训人员;通过机器及其他传感器来感知世界;通过ChatGPT等工具去学习新的东西。
虽然当前的人工智能具备了基本逻辑能力,但还处于早期发展阶段。人们主要将人工智能应用于一些工具型任务,价值主要体现在提升效率。AI最有价值的地方在于它具备和人类不一样的思维,未来如果融入想象力、主观能动性,可以解决单靠人类无法解决的社会问题。
机器学习泰斗、美国“三院院士”Michael I. Jordan认为,“缺乏对集体性、不确定性和激励机制的关注,是当前对人工智能的讨论中缺失的三个方面。”
他表示,“生活本身充满了不确定性,人也是非常不确定,互相交流则是创造了一种降低不确定性的文化,这是人类做得非常好的事情之一。但当前的人工智能系统并没有很好地做到这一点,其不善于思考不确定性,也不善于团结起来应对不确定性。相较之下,人类在面对不确定性时表现出色,尤其是集体协作共同应对时。”
除了提升单个智能体的能力,他呼吁建立一种能够体现集体智慧的协同智能体系统。他认为,在AI的构建中,设法让机器具备类似的群体协作能力,成为了一个亟待解决的关键课题。仅仅将人类的智慧融入人工智能中仍然是不够的,现代信息技术在医疗、交通、金融科技和商业领域的应用,需要建立集体性的智能系统。但如何让当前的人工智能系统也具备类似的集体协作能力,仍是一个未解的关键问题。
人工智能经历了两次智能涌现,第一次智能涌现是神经网络的神经元达到一定量级后产生了质变。模型技术至今已经发展很多年了,包括最早2018年Bert本身也是大模型,之所以GPT带来革命性的影响,是因为其参数超过了一定量级,突破了100亿、1000亿,GPT-4参数量甚至达到万亿级别,由量变产生质变。
第二次群体智能涌现的本质是,当单体Agent足够多,各行各业都有专业的Agent,如果把这些Agent都聚集起来,协同合作去完成某项任务,这个过程中有可能会产生新的发现。
事实上,人类很早就已认识到,通过群体合作集思广益,解决问题的成效可以大过个体智慧的总和。关于群体智慧的力量,在科学上有个经典的实验:在玻璃罐中放满糖果,然后请试验者来猜测糖果的数量,记录每个人的答案、答案的平均数及其与正确答案之间的关系。
以美国哥伦比亚商学院的实验为例,糖果实际数目为1116颗,73个学生参加实验,73人的个人答案有多有少,但都离1116相差甚远,而73人个人答案的平均值却为1115颗,与糖果真实数量仅1颗之差。这本质上是个预测问题,其结果正体现了群体的智慧。
卡内基梅隆大学组织行为学专家Anita Woolley表示,影响一个团队发挥群体智慧的最大因素正是成员之间的协调程度。尽管群体的协作能带来1+1>2的效果,但知易行难。
而随着人类社会文明的进化,从农耕时代、工业时代到知识网络时代、数据智能时代,人工智能技术的深入发展,在渗透社会生活的同时,也辐射到了群体智慧。在机器文明时代下,能否将人类的群体智慧融入人工智能,形成单体智能的放大效应,从而进一步释放人类社会的潜能,是一个值得思考的议题。
当单个智能体相互关联并协作时,它们能够形成一个复杂而强大的群体智能系统,从而产生出更加卓越的智能涌现行为,这成为人工智能近年来一个重要的发展方向。
群体智能(Swarm Intelligence,SI)最早源于对以蚂蚁、蜜蜂等为代表的社会性昆虫的群体行为的研究,自1991年意大利学者Dorigo提出蚁群优化(Ant Colony Optimization,ACO)理论开始,群体智能作为一个理论被正式提出,并逐渐吸引了大批学者的关注,从而掀起了研究高潮。
1995年,Kennedy等学者提出粒子群优化算法(Particle Swarm Optimization,PSO),此后群体智能研究迅速展开。目前,群体智能的研究主要包括智能蚁群算法和粒子群算法,智能蚁群算法主要包括蚁群优化算法、蚁群聚类算法和多机器人协同合作系统。其中,蚁群优化算法和粒子群优化算法在求解实际问题时应用最为广泛。
群体智能的核心在于分布式决策和协作,它通过算法让众多小型智能单元协同工作,共同解决复杂问题。这种技术的应用范围广泛,从交通优化、城市规划、工业生产到智能医疗等领域,都能看到其身影。
例如,在一个智能交通系统中,每辆车都是一个智能体,它们需要根据路况和交通规则来选择合适的速度和路线,同时也需要与其他车辆和行人进行沟通和协调,以避免碰撞和拥堵。在一个智能医疗系统中,每个医生、护士、患者和设备都是一个智能体,它们需要根据病情和资源的分配来制定合理的诊疗方案,同时也需要与其他智能体进行信息的共享和决策的协商,以提高医疗的效率和质量。
以交通为例,公路驾车群体是按照交通规则,以公路系统为平台,由一群具备单体智能的人类驾驶或自动驾驶车辆所构成。单体智能的弱点在于个体感知、通讯和控制的局部性,与其行为决策对全局的影响性之间的矛盾。
对人类驾驶员而言,由于交通互动的无序和对未知交通环境的不了解,很难在遇到突发交通状况、并道或绕过路障时保持正常车速,往往会由于降低车速而形成道路拥堵。
对于自动驾驶车辆,其在行驶过程中,处理问题的优先级通常是以自身为出发点,也就是以自身的安全与效率最大化为前提。如果每辆车都如此规划的时候,就会带来很多冲突矛盾,比如在路口会遇到由于相互博弈而卡住不动的情况。随着自动驾驶汽车规模的逐步提升,这类问题将愈加突出。
如果没有外力的加入,单纯依靠自动驾驶车辆自身的决策系统,不足以对全局形成更好的结果,这时就需要一个能够掌握全局性信息的群体智能系统进行全局协调。虽然群体智能所产生的结果对于单体来讲可能不是最优,甚至会出现效率降低的情况,但对全局而言,则是一个效率最高的最优解,可以实现系统效能的提升。
比如在一个路口,全局最优解是要保证所有人的通行时间都被节省,而不是某一个特例或者某一台车的时间被节省。
目前国家正在大力推行的车路云一体化,就是群智智能的典型代表,其通过各类传感器、云控平台、感知算法、数据融合、预测模型等设备和技术,把每一辆车、每一台基站等智能个体,都变成一个信息节点,它们互联互通,形成一个可以共享信息、协同运行的智能体网络。这个智能体网络从全局视角,为自动驾驶车辆提供最优行驶路径建议,解决交通效率问题。
站在系统发展角度看,自动驾驶追求越来越极致的智能化,而车路云一体化则追求的是极致的系统智能。一个是单点的智能化,一个是系统的智能化,只有这样才能在不同维度上解决不同的问题。如果是单点的问题,就交给单车去解决;如果是系统的问题,就交给系统去解决,一定是在不同层面用不同的方式去解决,而不是用一套方法来解决所有问题。
未来,当无人机、机器人、机器狗等更多智能体接入车路云网络,就可以直接获得城市更加丰富、完整的信息,比如自动驾驶车辆可以获得完整的交通信息,无人机可以获得空域的数字化信息,机器狗、机器人可以获得各自行驶路径上相应的环境信息,这样就构建起了一个完整、安全、高效、实时的超级智能体网络,以此为基础的智能城市也将由此诞生。
Science 2016年的论文“群体之力量”(The Power of Crowds)认为:结合群体智慧与机器性能来解决快速增长难题时,群智计算按难易程度分为三种类型:实现任务分配的众包模式、较复杂支持工作流模式的群智、最复杂的协同求解问题的生态系统模式。
在具身智能领域,由大模型驱动的多智能体高效协作是重点研究方向之一。
此前,大模型在具身智能中主要用于解决单智能体的任务规划问题。然而,由于大模型知识和特定的具身环境没有对齐,大模型产生的规划往往难以在实际环境中执行。
举例来说,在打扫房间的任务中,大模型给出的规划可能是首先找到吸尘器。然而,环境中可能没有吸尘器,只能通过扫帚能完成该任务。
此时,大模型需要通过和环境的多轮交互和反馈来使其适应于具身环境,因而具有高昂的交互代价。
在多智能体环境中,每个智能体都使用大模型进行控制。而当多个智能体协同完成一项任务时,除了会遇到类似单智能体的环境不适配问题,还存在多智能体如何高效沟通和协作的难题。
如果直接通过多智能体对话协商,来进行协作的方法是低效的。一方面,很难完全通过对话得出有效的协同策略;另一方面,无法衡量单个智能体对总体任务目标的贡献(即信度分配),难以驱动每个智能体改进策略来提升总体收益。
因此,多智能体协作系统(Multi-Agent Collaboration Systems,MACS)就十分必要,其目标是使多个智能体能够有效地协作,以实现一些超出单个智能体能力范围的任务。该系统可以用于模拟和优化交通、能源、物流等复杂系统,也可以用于智能家居、智能城市、智能工厂等场景的设计和实现。
在MACS下,多智能体协作框架(Multi-Agent Collaboration Framework,MACF)提供了实现智能体间合作与竞争的方法和工具,包括智能体建模、交互协调、评估优化、适应演化和人机交互等方面,主要用于协调和控制多个智能体,以实现共同目标或解决共同问题。其核心是平衡智能体间的合作与竞争,解决任务分配、策略选择、信息共享、学习方式和人类参与等关键问题。
MACF的分布式协作方式强调在分散环境中智能体间的信息共享和任务分配,通过强化学习、反馈、智能合约等手段提高性能和适应性。当前,比较主流的多智能体技术框架包括AutoGen、MetaGPT、XAgent、AutoAgent、CrewAI等,这些项目从不同角度提出智能体系统规划模块的改进建议,其中包括长短期规划、规划输出格式、用户提示拓展解释、反馈迭代机制等,为多智能体高效协作奠定技术基础。
需要指出的是,多智能体产生群体智能的前提是单智能体本身已经具有较高的智能化水平。单智能体的能力边界很大程度上影响着群体智能的能力发挥,就好比蚁群或蜂群的个体数量再多、组织再严密,也无法制造出摩天大楼。因此,充分激发单智能体的能力是释放群体智能价值的前提,而群体智能也将对单体智能体的潜力进一步开发,形成互为支撑、相互融合、相互促进的良性关系。
尽管存在算法复杂性、环境不确定性、人机交互和伦理法律遵守等挑战,但群体智能的发展前景依然广阔,其可以广泛应用于机器人、交通、教育、军事等各个领域,在提高系统性能和效率、增强系统鲁棒性和可扩展性、促进系统与人类的协同和互动方面发挥重要作用。
在机器人领域,群体智能可以使机器人能够完成更复杂和更困难的任务,提高机器人的灵活性和可靠性。比如在智能仓库中,每个机器人需要根据订单的内容和优先级,选择合适的货物和路径,同时也需要在群体智能系统下,与其他机器人开展协作,提高仓库的运营效率和客户满意度。
在智能救援场景中,机器人需要根据灾害的类型和程度,选择合适的工具和方法,同时也需要与其他机器人进行协同和支持,以提升救援的成功率和安全性。群体智能可以让机器人根据环境变化和任务需求,自动调整救援策略,并与其他机器人或人类进行有效协作。
针对教育场景,群体智能可以调动教师、学生、课程等各类资源,根据学习者特征、学习需求、学习目标、学习进度等,制定科学合理的教学和学习计划,从而提升教育效果。
在军事领域,群体智能还可以开启未来战场的全新模式。比如在超视距侦察系统中,无人机、卫星、雷达和传感器作为相互独立的智能体,需要在群体智能的系统框架下,根据任务要求和资源限制,与其他智能体开展合作,进行信息收集和全面分析,提高侦察的准确性和及时性。
虽然目前还没有一个完整的框架用来理解人工智能和群体智能间的交互,但作为人工智能的新兴分支,群体智能不仅展示了技术的革新力量,也为我们勾勒出一个智能社会的未来图景。在这个充满可能性的时代,我们期待群体智能为人类带来更多的惊喜和便利,同时,也需要保持警惕,确保科技进步的每一步都为人类福祉服务。