在我之前的文章《从LLM大模型到SLM小模型再到TinyML,这个领域有望增长31倍》中,曾经提到小模型SLM的进展,如今这一领域正在悄然发生突破。
小模型SLM,可以看作是大模型LLM的“迷你版”,它们虽然体型小巧,但却拥有着不容小觑的能力。相比动辄数百万、数十亿参数的GPT-4等大模型,SLM的运行规模要简单得多。经过优化的SLM能够高效处理较为简单的任务,而无需消耗大量计算资源。
如今,小模型正朝着产业落地的方向大步迈进,它们不再是实验室里的“玩具”,而是正在成为各行各业的“生力军”。
科技巨头们已经嗅到了小模型的无限潜力,纷纷加入这场争夺未来的战局。
微软、谷歌和苹果等公司均已入局小模型SLM,例如微软的Phi-3、谷歌的Gemma和苹果的Foundation Models。
最近,微软更是推出了适用于工业领域的全新AI小模型。
通过与拜耳、罗克韦尔自动化、西门子等公司合作,这些小模型使用行业特定数据进行了预先训练,可用于处理一些关键问题。这就像是为每个行业量身定制了一套“智能装备”,让AI的力量深入到每个生产环节,提升效率、优化流程、创造价值。
今天这篇文章,我们将一起探索小模型在工业应用中的最新进展,了解它们所蕴藏的机遇与挑战。
首先,我们需要进一步理清大模型与小模型之间的区别,如上图所示。
小模型之所以“小”,不仅仅在于其参数数量较少,更重要的是,小模型常常在小型数据集上进行微调,以优化其在特定任务上的性能,使其更加契合业务工作流的需求。
小模型的强项在于处理特定任务和工作流程。尽管参数数量有限,但当使用定制数据集针对特定领域任务进行微调时,小模型完全能够胜过大型通用模型。针对特定任务的训练可以减轻幻觉现象,增强问题解决能力。
资源效率是小型语言模型的另一大亮点,对于希望跨越各种平台和设备实施AI解决方案的企业来说,它们尤其具有吸引力。小模型使企业能够以更简单的基础架构和更低的成本,充分享受AI带来的优势。据测算,小模型可以节省高达75%的模型训练成本和超过50%的总部署成本。
在小模型的基础上,我们还可以玩出许多新花样。
一些公司将小模型用于AI代理工作流中,其中多个小模型通过通信和协作来执行更加复杂的任务。
例如,在AI代理工作流中,第一个AI代理可能负责规划如何解决任务,第二个AI代理进行必要的研究,第三个AI代理执行该计划,第四个AI代理则验证和评估结果。这种协作方式展示了这些模型如何协同工作,以提高生产力并实现更复杂的结果。
说到这里,我来解释一下什么是AI智能代理。
AI代理的官方定义是一种能够感知环境、进行决策和执行动作的智能体。
简而言之,ChatGPT不属于AI代理,但战胜李世石的AlphaGo可以被视为AI代理。
目前,我们与AI的交互形式基本上都是先输入指令,AI模型根据指令内容做出响应,这就导致我们每次都需要提供有效的提示词,才能达到预期效果。
而AI代理则不同,它被设计为具有独立思考和行动能力的AI程序。我们只需要提供一个目标,比如写一个游戏、开发一个网页,AI代理就会自主生成一个任务序列,开始工作。
让我们通过几个例子来更深入地理解AI代理。
一个初级的AI代理,是家中的空调自动控制系统。它遵循简单的“如果-那么”原则运行:如果温度低于设定点,则打开空调暖风;如果温度高于设定点,则关闭空调暖风。这种基础的AI代理虽然简单,但在日常生活中已经发挥了重要作用。
而高级的AI代理,如DeepMind的AlphaGo,则是专为复杂的围棋而设计的人工智能系统。AlphaGo展示了非凡的学习能力,最终击败了世界冠军围棋选手。这一里程碑式的事件,彰显了AI代理在处理复杂任务方面的巨大潜力。
就像俄罗斯套娃一样,多个初级和高级的AI代理可以建立起分层代理系统。
分层代理是一种将复杂任务分解为更简单的子任务,并以分层结构组织起来的AI系统。这种方法允许代理管理不同级别的抽象,更有效地处理复杂问题。
分层代理的一个典型例子,就是亚马逊Amazon Go商店的“Just Walk Out”技术。该系统在运作中表现出了清晰的层级结构:
依靠这些AI代理的协同工作,Amazon Go以“不用排队,拿了就走”的全新购物体验,在零售行业和科技圈吸引了无数目光。
上述案例只是冰山一角,AI代理在实际应用中的想象力正在被激发。
在了解了小模型与AI代理的概况后,让我们一起探索微软与工业企业的最新合作。
本次尝试微软小模型的企业包括拜耳、罗克韦尔自动化、西门子、Sight Machine等。
以罗克韦尔自动化为例,该公司从操作层面开始尝试应用小模型。在人机界面可视化平台FactoryTalk Optix的食品和饮料版本中,他们运用小模型,将行业特定功能的优势带给制造业一线工人,支持食品和饮料领域的资产故障排除。AI模型为工厂车间工人和工程师提供关于特定制造流程、机器和输入的实时建议、解释和知识。
另一款产品FactoryTalk Design Studio是罗克韦尔自动化专注于系统设计的云原生软件,它使用Copilot增强了PLC代码创建和用户管理。工程师能够使用自然语言提示执行产品指导、代码生成、故障排除和代码解释等任务,使系统设计更快、更直观。
同样,西门子正在为CAD解决方案NX X软件引入全新的Copilot。该软件利用经过调整的AI模型,使用户能够通过自然语言提问、获取详细的技术见解并简化复杂的设计任务,实现更快、更智能的产品开发。
目前,包括舍弗勒和蒂森克虏伯自动化工程在内的100多家公司正在使用西门子工业Copilot来简化流程、解决劳动力短缺问题并推动创新。12万名西门子工程软件用户,现在有机会通过生成式AI驱动的助手来提升工作效率。
作为敢于吃螃蟹的用户,蒂森克虏伯自动化工程公司是首家使用Copilot的公司,并且计划从2025年初开始,在该公司的全球体系内普及应用。
根据实践,工程师现在可以在30秒内创建可视化面板,并生成代码,根据经验这些代码仅需20%左右的调整就可以直接应用。这简化了工作流程,减少了人工工作量,解决了熟练劳动力短缺的问题。
就具体场景而言,蒂森克虏伯使用AI辅助开发用于生产汽车电池的自动化系统。例如在一台电池质量的检测装置中,传感器、摄像头和测量系统集成在一起,监控多个阶段的电池单元质量,进行复杂的评估以检测超出设定阈值的放电。Copilot通过自动执行多个任务,如数据管理、传感器配置、电池质量检测等各个重复性步骤,辅助操作员增强了该设备的运行效果。
在工业领域,“想到”和“做到”完全是两码事,生成式AI的工业价值尚需被验证。
古人云“欲得其利、先知其弊”,要充分发挥小模型的优势,就必须了解它的局限性。
生成式AI的弊端在于可靠性较低,具有不可解释性,只能应用于对可靠性要求不高的场合。
小模型的缺点则是精度有限,无法捕捉大规模和复杂数据集中的细致特征和关系,预测能力相对较弱;此外,它们难以应对复杂问题。这些弊端决定了小模型只能承担辅助思考的角色,为我们提供更多可行性方案作为选择,而最终决策仍需由人来做。
在实际应用过程中,也是挑战重重。
工业领域广泛使用AI的最大障碍是数据的缺失。由于工业涉及设备、工艺、操作、环境等多重因素影响,获取大量且多维的全面数据难度很大。大多数制造商虽然坐拥数据,但其中大部分是时间序列数据,没有得到适当的标准化,甚至无法用于AI的模型训练。
数据问题的本质,很多时候不单纯是技术问题,而是人员和流程问题。不成熟的数据管理流程、始终存在的OT与IT鸿沟,以及缺乏对小模型的理解,都是导致生成式AI目前仅限于一次性试点或实验的因素。
因此,目前生成式AI在工业领域更多以虚拟助手的功能存在,并将会持续较长时间。
这些AI虚拟助手为工厂车间操作员提供指导,或帮助控制工程师编写PLC代码。鉴于当前吸引和留住工厂车间人才的挑战,Copilot能够轻松帮助合成实时信息或提供编码辅助。
过去,工程师需要熟悉云平台、传感器、物联网、人工智能和不同类型的时间序列和工程数据,而生成式AI则允许工程师轻松进行数据查询、可视化和工作流程,而无需担心复杂性。操作员可以按需提出问题,而不需要了解软件。
许多制造企业配备了复杂的系统和更多的自动化设备,但那些拥有几十年经验与知识的资深员工却逐渐离开了职场,制造商们很难找到年轻的技术人员来维护现有的系统。Copilot可以成为帮助缩小这一差距的工具。
例如,工业软件企业Aveva的AI助手可以帮助操作员回答以下问题:上个月车间的最大产量是多少?或者为什么这台压缩机本周效率较低?杜邦公司也已经开始使用生成式AI来帮助工程师更快地找到信息,生成式AI可以节省数小时的手册搜索时间。
这些Copilot就像操作员的专家顾问,根据需要建议如何提高产量、降低能耗等。从某种意义上说,它们与原有的“专家系统”并没有本质区别,是否采纳这些建议取决于操作员。
面临的挑战也与过去的“专家系统”大同小异:如何建立对顾问的信任。工厂中的新配方经常出现,如果没有适当的更新和维护,专家系统也会很快过时。另一个风险在于,如何检查和验证所有生成式AI的输出。AI不会说“我不知道”;如果没有数据,它可能会进行编造。
在这个万物互联、智能无处不在的时代,小模型和生成式AI正在工业领域掀起一场革命。从制造车间到产品设计,从运营优化到故障诊断,AI正在重塑着每一个环节。
然而,我们也必须清醒地认识到,工业领域的AI应用之路并非坦途。数据缺失、可靠性不足、解释性有限等挑战,都在提醒我们要谨慎对待这项新兴技术。尽管如此,我们仍然有理由对未来保持乐观。
随着技术的不断进步和企业实践的深入,人机协作将更加紧密,小模型和生成式AI也将在工业领域释放出更大的潜力。
参考资料:
《忍不住谈谈工业大模型》,作者:郭朝晖,来源:蝈蝈创新随笔
《Microsoft Introduces New Adapted AI Small Language Models for Industry》,作者:Colin Masson,来源:ARC Advisory Group
《What is Agentic AI? Is It the Next Big Thing?》,作者:Nora He,来源:arcee.ai