Omdia观察:云原生网络运营日益复杂 电信业聚焦自动化智能化
2 周前 / 阅读约8分钟
来源:C114

C114讯 12月23日消息(艾斯)2024年10月7日,欧洲电信标准协会(ETSI)网络功能虚拟化(NFV)小组举办了一场研讨会,探讨ETSI NFV电信云(Telco Cloud)的未来方向以及人工智能(AI)的作用。包括ETSI NFV、德国电信、华为、NTT DoCoMo、OpenInfra、Orange、Telenor和Telefónica等重要企业和行业组织都参与了此次活动。

市场研究公司Omdia资深分析师Inderpreet Kaur在一份最新的报告中对本次研讨会进行了总结,这位分析师写到,业界认识到,云原生网络运营的正变得日益复杂。已完成云原生迁移的运营商认为,向基于GitOps的网络元素生命周期管理进行过渡是基础。他们的新做法依赖于声明式部署和所需网络状态的管理。GitOps和AI在提高NFV管理和编排(MANO)的自动化和智能化方面的作用正在探索当中。

云原生网络的运营复杂性很高

随着网络系统从单片设备转向虚拟化或基于云的网络,运营复杂性正在增加。云原生网络遵循分层架构(如图1所示)。它受到三个主要趋势的影响或塑造:

·解耦架构——这意味着将移动基站等网络系统分解为不同的集中式和分布式基带单元。如果我们将其扩展到5G核心网(5GC),它还涉及基于微服务架构将容器化网络功能(CNF)进一步分解为的更小的软件模块。

·开放性——这体现在增加使用开源软件以及网络组件之间实施云原生开放接口方面。开放性的这两个方面对于支持供应商中立的部署实施是必要的。O-RAN联盟等组织也在推动开放性的实现。

·电信网络的“软件化”——这意味着硬件和基于软件的网络功能的完全解耦。它反映了从专用硬件到虚拟化网络功能(软件)的转变,这些功能具有明确定义的API,可以托管在商用现货(COTS)服务器和加速硬件上。

图1:云原生网络的分层架构。资料来源:Omdia。

云原生运营模式

云原生和开放网络的一个关键内涵是,架构组件可能不再由拥有端到端系统管理和运营所有权的单一供应商提供。因此,云原生的运营模式与传统网络的运营模式截然不同。德国电信、Orange和沃达丰等运营商预期自身在管理这种复杂性方面承担更多责任。

由于有如此多具有独立生命周期的组件,在云原生运营模式中变更管理需要持续集成和部署工具,并且它应该能够支持:

·基础设施的持续升级;

·尽可能降低对客户流量影响的在役软件升级;

·对问题进行端到端的故障排除,特别是应用程序与底层基础设施之间的互操作性。

德国电信在其2024年资本市场日活动的演讲中强调了现代电信网络中这些变化的幅度和规模。该运营商每年在德国和欧洲的网络中实施250万次变更,为客户提供创新和最佳服务质量。手动管理如此庞大的规模并且做到万无一失,这无疑是一项艰巨的任务。它需要在云原生堆栈中实现自动化,并将AI引入各种交付这些自动化的工具中。

提高电信云运营的自动化和智能化

10月7日于巴黎举行的ETSI NFV研讨会强调了运营云原生网络存在的挑战。与会的电信运营商(德国电信、Orange、Telefónica和Telenor)以及OpenInfra等开源组织发表了多场演讲。

在运营商内部或与技术合作伙伴共同努力应对云原生运营模式的挑战的同时,ETSI NFV等标准组织也已开始了初步研究。ETSI NFV工作委员会认识到,需要提高NFV MANO的自动化和智能化。ETSI NFV MANO现有的Release 4已经具有自动化机制,可以支持电信云的自动扩展、自动修复和策略管理。ETSI在其最近关于NFV记录架构和演进的的草案报告(ETSI GR NFV- ifa 054 V0.9.0, 2024年9月)中强调了以下改进MANO自动化的进展:

·新的自动化技术,如DevOps,可用于扩展对NFV MANO的自动化支持。

·AIOps可用于优化MANO中的端到端自动化以及引入自动决策。预计将在四个关键领域产生影响:

-基于意图的网络管理将帮助MANO系统将服务提供商的需求转化为网络政策和行动;

-使用AI进行容量规划将使MANO能够更有效地配置、使用和协调资源;

-使用AI进行智能服务调度将进一步提高资源管理和利用率;

·在其他领域,ETSI工作委员会正在探索使用数字孪生技术来模拟和验证网络部署。

因此,针对电信云运营和管理的拟议结构(如图2所示)有一些新的组件。除了电信云应用管理(TCAM)和电信云基础设施管理(TCIM)之外,该架构还引入了电信云自动化支持(TCAS)的功能块。

TCAS负责电信云运营的自主管理。初期重点仍然是两个关键功能:

·电信云意图管理。为MANO和其他系统(如运营支持系统OSS)之间的接口提供意图驱动或声明式管理。

·电信云管理数据分析功能。利用AI/ML技术来帮助优化整体系统性能。

图2:ETSI NFV电信云MANO的拟议架构增强。资料来源:ETSI NFV。

运营商强调在MANO中使用AI和GitOps

德国电信和Telefónica将GitOps视为在NFV MANO中实现基于意图的自主运营的关键工具。MANO是虚拟化网络或云原生网络中的关键管理模块。它负责根据网络功能(NF)和网络服务的需求协调虚拟(VM和容器)和物理电信云基础设施(TCI)资源(计算、存储和网络)。

如前所述,云原生运营模式必须支持软件交付和基础设施配置。德国电信和Telefónica都强调,Kubernetes(K8s)原生支持基于GitOps的声明式云资源部署和管理。K8s符合基础设施即代码(IaC)原则,在该原则下,集群配置作为代码构件提供。这些配置存储在Git存储库中,该存储库充当版本控制系统,并保存对云基础架构所有更改的历史记录。德国电信和Telefónica正致力于用AI来为其GitOps驱动的流程提供补充。

AI辅助的CNF生命周期管理

德国电信正在试验用AI来辅助CNF的开发、推出和运营中的各种流程(见图3)。电信运营商负责交付网络功能(CNF和VNF),在其测试环境中测试软件,将软件集成到运营商使用的其他系统中,对系统进行验证测试,将软件部署到生产环境中,对软件进行持续监控,并向供应商提供反馈。

·在开发阶段,德国电信使用基于AI的验证框架进行回归测试。回归测试用于确保系统在引入更改后按预期运行。该框架聚焦于通过预测更新可能导致的缺陷来分析软件配置变更的影响。该框架有助于建议或优先考虑测试用例,以改进回归测试。

·在推出阶段,AI的一个关键用例是网络配置co-pilot.。co-pilot有助于基于以前的配置自动执行新的合并请求。它还支持与供应商提供的文档进行基于聊天的交互。

·基于AI的服务保障和根本原因分析(RCA)构成了生产集群的平台即服务层(PaaS)的一部分。该功能提供了通用测试功能(例如定期服务探测)以及来自所有平台组件的广泛日志记录。它用于根据在不同层中发现的异常进行故障预测。

图3:AI辅助的CNF生命周期管理。资料来源:Omdia,基于德国电信的演示。