给AI大模型装上眼睛:车路云网络重构大模型发展?
18 小时前 / 阅读约12分钟
来源:36kr
AI从未停止给人类惊喜~

人工智能从未停止进化,也从未停止给人类带来惊喜。

从文生文、文生图到文生视频,从ChatGPT、Dall-E到Sora,生成式AI跨越壁垒、一路狂飙,向人们展示了人工智能时代超越边界的想象力和爆发力。

当前人工智能的发展具有“大”和“多”的特征,大模型的参数规模越来越大,文、图、视频等方面的多模态能力也越来越强,无论是国内还是国外,都经历了一场有关人工智能的巨变。

大模型的持续进化离不开海量数据的支持,以至于业内将数据形容为推动人工智能发展的“燃料”和“矿产”。不过,人工智能巨头OpenAI公司联合创始人兼前首席科学家伊利亚·苏茨克维尔近日公开警告,“AI的训练数据如同化石燃料一样面临着耗尽的危机”。《自然》杂志最近也在头版敲响警钟——人工智能革命正“吸干”互联网数据的海洋。

另一方面,目前科技公司竞相追逐的通用大模型,基本都是基于历史静态数据训练,比如全球互联网上的文字、对话、图片和视频,先不说其本身数据的真实性,仅仅依赖这些静态数据训练的通用大模型对真实世界的理解力本身就值得怀疑。这点已经遭到众多硅谷科学家的诟病,他们指出,基于现有互联网数据训练的大模型,可能训练出具有片面世界观的“怪物”。

因此,物理世界的实时数据就显得更加重要。这也是马斯克所支持的大模型计划被看好的原因——基于其遍布全球的数百万辆特斯拉汽车收集的真实动态数据,将有助于其训练出更“高级”的通用人工智能大模型。

AI大模型所面对的困局,或许在中国迎来转机。随着车路云一体化、自动驾驶、具身智能等技术的兴起,一些科技公司正大力推动车路云网络建设和应用——车路云网络本身就是一个物理世界的实时动态数据库,其规模远超想象,并时刻都在产生全新的真实数据

这或许会为AI大模型提供连接物理世界与数字世界的全新数据引擎,驱动人工智能持续进化、迭代升级,帮助AI大模型更好地理解真实世界。

下一代大模型的数据新引擎

近日,中国科学院院士梅宏表示:“现在的公交车、出租车、地铁等各种出行方式的数据,均是由各自独立的信息系统来汇聚的,形成了一系列的数据孤岛。如果要把这些数据汇在一起共享融合,需要实现各系统间的互操作。如果每个机构都做一遍,成本很高,效率也很低。因此,需要构建一套新型基础设施,从根本上支撑数据在互联网上的互联互通,这就是所谓的数据基础设施,它本质上是互联网技术体系的一次拓展和延伸。”

聚焦到交通场景,交通是一个非常典型的从感知、认知、到决策、控制的过程。传统人工智能在里面目前只呈现碎片化应用,比如识别信号灯、识别违章等。

想要真正解决问题,需要用车路云这一根线,把车流、道路、交通信号等所有的散点串联起来,形成更高维度的全局智能,通过对车、路、云、网等交通关键节点开展智能协同,形成对交通态势的全面、及时、精准的感知、控制与决策。

人们所熟知的人工智能大模型是拥有超大规模参数(通常在十亿个以上)、复杂计算结构的机器学习模型,通常能够处理海量数据,完成各种复杂任务,如自然语言处理、图像识别等。传统的通用大模型擅长处理文本、语音、图像和视频等四类数据,但对车路云领域来说,准确理解空间坐标、实时动态数据的分析处理、未来物体轨迹预判才是核心。这也进一步强调了车路云与现有人工智能技术的本质区别。

 2024年,是我国全面布局车路云一体化的“元年”。

年初,工信部发布的《关于开展智能网联汽车“车路云一体化”应用试点工作的通知》提出,要建设智能化路侧基础设施,实现试点区域5G通信网络全覆盖,部署LTE-V2X直连通信路侧单元等在内的C-V2X基础设施。通过新一代移动通信技术将人、车、路、云一体化,建立系统性数据平台,产业化规模落地应用,就是智能驾驶的“中国方案”。

7月初,工信部公布了20个城市(联合体)为“车路云一体化”应用试点城市。

10月,工信部相关负责人在国新办新闻发布会上表示,下一步将深入开展智能网联汽车准入和上路通行试点、“车路云一体化”试点,稳妥推进自动驾驶技术产业化。

目前,中国已经形成相对成熟的车路云一体化建设方案,主要由设备端、通信服务、云平台、车路云应用、车路云安全等部分组成。其中,在政府机构主导的项目推动下,路侧基础设施及平台建设率先开展。

行业发展的生命力在于持续不断进行实践创新,通过行业实践破解关键问题,从而推动行业螺旋上升。比如车路云行业大模型,其在解决车路云协同中的一些关键挑战方面具备独特优势,特别是在复杂环境中提供高级的感知和理解、动态管理交通流量、协调异构交通参与者、实时数据处理和决策等方面。

在复杂的城市环境中,例如在拥挤的街道、复杂的交叉口、恶劣的天气条件下,传统大模型由于缺乏对物理世界的感知能力,难以准确感知和理解交通环境。车路云大模型可以通过使用深度学习算法和大规模训练数据,准确地识别和理解复杂环境中的各种对象和情境,如行人、自行车、其他车辆、道路标志和临时路障等。

 预测和管理动态变化的交通流量是车路云协同面临的一大挑战,尤其是在高峰时段或特殊事件(如道路施工或大型活动)期间。针对这一点,车路云大模型可以利用实时数据处理和分析能力,并结合历史和实时的交通数据,预测交通流量变化和潜在拥堵点,从而帮助优化交通信号控制和车辆路径规划。

在车路云环境中,需要协调不同类型的交通参与者(如不同品牌和型号的车辆、非机动车、行人)的行为,这在传统交通系统中是一个挑战。车路云大模型通过高级的模式识别和预测算法,理解和预测不同交通参与者的行为,有效地协调它们之间的交互,提高出行安全和交通效率。

实时收集、处理和共享大量交通数据,并据此做出快速决策,是交通系统面临的重要挑战。车路云大模型借助强大的计算能力和智能算法,能够快速处理来自车辆、路侧基础设施和其他传感器的大量数据,并实时做出准确的决策。随着城市交通环境和规则的不断变化,车路云大模型还具有自我学习和适应的能力,可以根据新的数据和经验不断优化自己的算法和策略,以应对不断变化的交通环境。

得“通感算”者得天下?

作为未来智能城市的底层系统,车路云一体化通过集成AI数字道路基站、卫星通信和定位、各类传感器、无人机、机器人等关键基础设施,构建起一个无缝交互、高效协同的网络系统,为用户提供高精度、实时数据服务。

从车路云一体化的发展路径看,主要经历了四个阶段。

第一阶段是信息交互协同。主要实现车辆与道路的信息交互与共享;

第二阶段是协同感知。在信息交互协同的基础上,进一步利用车载和路侧的感知设备,对道路交通环境进行实时高精度的感知定位,从而为自动驾驶提供更全面、更准确的环境信息;

第三阶段是协同决策控制。在协同感知的基础上,进一步实现道路对车辆、交通的决策控制;

第四阶段是车路云一体化。通过融合智能网联车辆、路侧设施及云端平台,提供更全面、准确的交通环境感知,并协同交通场景各参与要素进行高效的全局智能决策。

在车路云网络的加持下,道路通行能力得以提升,智能驾驶将变得更加安全。当下的自动驾驶汽车,仍无法在追求极致安全与道路效率两者之间形成优雅的平衡。当每一辆车都成为智能体的时候,它们各自的决策发生冲突时会形成一种算法博弈。如果两辆车都决定加速,就可能发生碰撞;如果同时减速,效率又会降低;另外还会遇到车辆在路口的相互博弈,导致车辆停在路中间,又会引发交通拥堵。

车路云网络作为交通中统一的关系协调方,其价值正在于通过全局智能决策,成为协调各交通要素之间关系的枢纽,通过借助大模型、深度学习等人工智能技术帮助各方做出更好决策,从而构建起良性的交通关系,保障交通的通行效率和安全性。

蘑菇车联创始人兼CEO朱磊认为,车路云一体化的本质是构建一套“通感算”网络,通过对实体世界进行实时数字化,为智能设备提供实时数据服务。这一网络现阶段主要为交通和车辆服务,但未来其应用范围将扩展至无人机、机器人等一系列智能体,形成一个实时的、城市级的数字孪生系统。

想象一下,通信网络仿佛是神经,算力系统如同大脑,感知相当于感官,三者深度打通,通感算网络仿佛变成了一个自智化、价值化的系统。

功能层面,通感算网络是同时具备“物理-数字”空间感知、泛在智能通信与计算能力的网络。

在通感算网络中,各类传感器、智能体通过软硬件资源的协同与共享,不仅能够感知物理世界的各种信息,包括位置、速度、姿态、环境等,并将这些实时信息转化为数字信号进行处理和传输,可以应用于自动驾驶、智能制造、智慧城市等领域,还能实现多维感知、协作通信、智能计算功能的深度融合。这种融合可以带来更高效的信息处理、更低的时延和更高的可靠性。

通过广泛的连接能力,通感算网络可以实现人与人、人与物、物与物之间的智能通信。作为庞大的实时数据网络,通感算网络可以大规模获取实体世界的全局数字化信息,为普通汽车、智能汽车、机器人、无人机、低空飞行器等智能设备提供系统级的实时数据服务,这些智能设备可以基于全局数据信息进行实时决策和精准规划,实现更高效的协作。

在叠加大模型之后,通感算网络具备了对真实物理世界的理解能力,可以对海量数据进行实时处理和分析,实现智能决策和优化。

为了构建通感算网络,需要解决一系列技术难题,包括通感算一体化空口技术、网络化感知技术、智能算力网络技术等。这些技术的研发和应用将推动通感算网络的发展,为未来的交通智能化建设提供强有力的支撑。

空天地一体化理想照进现实

除了交通领域,通感算网络还可以整合地面网络和非地面网络,在全球范围内提供泛在接入,并融合低轨或超低轨卫星、无人机和高空平台站等作为移动终端或节点组成的非地面网络,形成空天地一体的泛在接入网络。

通感算网络获取的实时物理世界数据还可以用来反哺自动驾驶模型、机器人模型的训练。比如可以根据不同城市特点,训练最适合当地驾驶行为的自动驾驶模型;根据不同工作和工种特点,训练最适合不同工作场景的机器人。

当智能设备规模越来越大,最具合理性的方式一定是尽可能降低对单体设备在计算能力和实时感知能力方面的依赖,通过整个网络来承载巨量的数据处理和计算分析。

比如针对自动驾驶感知受限问题,通感算网络利用数字道路基站,以及摄像头和毫米波雷达等感知设备,对路面情况进行感知并进行视频流的压缩。并通过车载通信链路将压缩后的图片或视频上传至配置了图像分类识别算法的基站进行处理。

数字道路基站配合路侧边缘计算系统,在原视频的基础上提取出包含行人、障碍物或路面情况改变的关键帧并对这些帧进行分类。基于图像分类识别算法进行图像识别处理,再将处理后的结果下发给车辆终端,从而实现通感算赋能自动驾驶车辆的超视距感知能力。

基于通感算一体化提供的成像、地图构建和环境重构能力,自动驾驶车辆可以在未知的环境中化被动为主动,执行自动导航和路径规划等更具决策能力的任务。

通感算网络让车辆在进行实时通信交互的同时,也为其开了感知的“天眼”,能够“看见”更多,“了解”更多,“创造”更多。

在智能化的大趋势下,聪明的车和智慧的路正加速融合。随着政策持续加码、技术路径跑通、商业场景落地,车路云一体化所面临的挑战正被进一步廓清,前景也更加清晰。

市场永远不缺少投机者,而坚定者更加弥足珍贵。任何一个产业发展的关键期,都将考验参与者的战略定力,也只有吃透用户、吃透市场,才能最终在市场真正立足。

  • C114通信网
  • 通信人家园