华为数据中心自动驾驶网络从L3演进到L3.5,瞄准复杂异构网络挑战

极客网·极客观察(朱飞)9月30日 在各行各业数字化转型加速的今天,新应用的需求和业务变更快速发生、层出不穷,应用程序和业务系统进一步成为企业的“生命线”。随着云原生应用架构的出现,以及多云部署业务成为常态,作为支撑应用程序和业务系统的“数字神经系统”,企业数据中心网络面临诸多挑战,包括不仅需要实现跨云跨网络的可扩展性和高性能,还要通过广泛的自动化来获得更高的敏捷性和灵活性,以支撑数字化应用及业务的瞬息万变。

数据中心网络自动驾驶,需要持续进化以适应这种局面。9月27日,在华为2021全联接大会上,华为基于在去年实现的L3数据中心自动驾驶网络已在单一网络内实现高度自动化的基础,进一步面向全球发布L3.5数据中心自动驾驶网络方案,将目光瞄准数据中心多云多厂商异构网络成为常态情况下,割据式管理导致的自动化参差不齐的现状,帮助客户实现复杂异构全数据中心网络的端到端自动化。

什么是数据中心自动驾驶网络?其目标愿景和分级标准是什么?从L3演进到L3.5,华为看到了什么问题?如何解决之?更高阶的自动驾驶网络未来该如何推进?让我们一探究竟。

以自服务、自维护、自优化为目标,数据中心自动驾驶网络持续演进

在整个网络通信业界,自动驾驶网络的提法并不陌生,相关标准、技术、方案及应用一直是业界重点关注的话题。具体到数据中心网络领域,由于当代数据中心网络肩负着数字经济时代企业应用程序和业务系统最仰赖的海量数据的联接和转发重任,而当前数据中心网络的运营维护还存在大量的人工编排、人工检校、人工排障、人工恢复等诸多人工断裂点,其自动驾驶的探索和应用尤其重要。

总体来看,业界已达成高度共识,将数据中心自动驾驶网络划分为L0~L5级,赋予每个级别不同的关键能力特征,从无自动化逐级上升到完全自动化。其中华为的整体解决方案由基础设施、管控系统、云端训练系统三层组成,覆盖网络规划、建设、运维和优化等全生命周期过程,包括规划设计、部署开通、业务发放、网络变更、监控排障、调参优化六个子环节,帮助企业逐步向自服务、自维护、自优化的无人值守数据中心网络演进。

在今年3月发布的超融合数据中心网络CloudFabric 3.0解决方案中,华为基于全以太架构构建0丢包的计算和存储网络,助力算力100%释放,率先实现了业界唯一的L3自动驾驶网络能力。在这一阶,华为构建了“规、建、维、优”四个环节全流程的智能化能力,帮助客户实现了单一网络的自动化、服务化,助力业务秒级发放;同时实现了网络从被动运维到主动运维的转变,保证业务7X24在线。

从L3到L3.5,华为着力解决多云多厂商复杂异构网络的自动驾驶难题

值得注意的是,上述L3数据中心自动驾驶网网络所取得的成果是在全以太网络架构下实现的,但现实中企业的大量业务是由多云多厂商提供支撑的,大量企业的数据中心网络也并未实现统一的全以太网络架构,从而导致多云多厂商多网络架构络并存,这给企业数据中心网络进一步迈向服务化、提升自动化水平带了诸多挑战。

首先,七国八制下,多云和多厂商网络模型差别巨大,各自的控制器只能管理自家设备,使得人工断裂点攀升,一个跨云跨厂商的复杂业务甚至会出现100+断点。

其次,IT团队和网络团队使用不同的工作视图,多视图割裂导致网络能力不能被业务视图调用,导致业务出现异常时需要多部门人肉式协同定位故障,耗时耗力且耗心情。

最后,不同业务团队会根据业务需求拆分网络工单,数量从数个到几十个不等。在众多业务团队众多工单并行的模式下,网络部门被迫不断在工单间切换,每天都被大量的零散工单淹没。更折磨人的是,由于逐单执行但始终看不到业务全局视角,因此即使所有的业务工单都执行完成了,网络是否能够完全满足业务的需求仍然不得而知。

“去年华为L3数据中心自动驾驶网络已在单一网络内实现高度自动化。”华为数据中心网络副总裁吴圣伟发布会上表示:“L3.5则在L3单一网络自动化基础上推进到了多云多厂商全场景网络服务化,可支持多云协同、网络全量基础原子能力的开放,以及在构建在这两大能力之上的全网数据的融合,助力企业业务在复杂异构网络环境下也能够敏捷创新。”

具体来看,在核心部件iMaster NCE智能管控析系统的支持下,华为L3.5数据中心自动驾驶网络方案将从以下三个方面解决上述难题:

• 通过业务设计平台,调用全网范围的100+开放原子,实现任意业务流零断点的灵活编排;同时以组件发布,提供面向业务的网络服务整合,使得工单数量减少90%,设计工作量减少70%,业务上线从月到分钟级。

• 从单一网络扩展到公有云/私有云/驻地云等网络统一管控和自动化,达到跨云网络秒级开通;

• 南向基于AOC平台,并对于多厂商网络统一数据建模,实现全网无差别可视与仿真,配置变更0差错。

参照汽车自动驾驶的进展情况看,数据中心自动驾驶网络从L3到L3.5升级“半代”也殊为不易,就像汽车自动驾驶需要处理人车路协同一样,L3.5数据中心自动驾驶网络也要深度理解企业在各种网络架构下的工作负载和应用程序,先实现单一网络的自动智能,再实现多个网络之间的自动化、智能化协同。

数据中心自动驾驶网络从1到N是长期实践,需要产业各方携手推进

而这背后,显然是单一技术提供商独自为战无法完成的,必须是技术方案与客户场景的互相理解、深度融合,并且在不断的应用实践中“发现新问题--拿出新方案--解决新问题”,才能推动数据中心自动驾驶网络朝着自服务、自维护、自优化终极目标不断靠拢。

这也正是华为长期秉承的实践方略。早在2020年9月的开放数据中心峰会(ODCC)上,华为就携手行业客户和产业伙伴面向全球发布了《数据中心自动驾驶网络白皮书》,全面阐述数据中心网络的未来愿景、目标架构、分级标准和应用实践,为企业建设新一代数据中心网络提供标准参考。同年12月,华为又与IDC开展合作发布《数据中心自动驾驶网络指数报告》,与时俱进识别企业数据中心自动化转型诉求,评估自动驾驶网络水平,提供升级演进指导建议。

截止目前,华为数据中心网络方案已经在全球包括金融、政府、互联网、制造、能源等各大行业超过12000家客户的数据中心部署,其中iMaster NCE智能管控析系统已在全球4000+数据中心成功商用,帮助他们通过重构网络架构和运营模式,获得业务敏捷性和可靠性,同时降低运营费用(OPEX)和建设成本(CAPEX),构筑了面向数字经济时代的新型竞争力。

面向未来吴圣伟坦言,“自动驾驶网络从1到N是一个长期实践、发展演进的过程。华为一直致力于基于客户场景和痛点,以发展的眼光解决问题,期望携手各方客户和产业伙伴,共同持续推进网络AI技术的大规模成熟应用,加速数据中心网络迈向使能敏捷商业、极致体验与高效运维的自动驾驶时代。”


极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。