中国电信杨明川:AI助力运营商数据中心智能化运维

10月17日消息(乐思)在昨日召开的“2018开放数据中心峰会”上,中国电信北京研究院副总工程师云计算与事业部总监杨明川指出,现阶段,电信运营商拥有大量的数据中心,而人工智能(AI)正在成为大型数据中心的重要组成部分。

杨明川称,智能化的数据中心的发展要分为三个阶段。当前阶段,人工智能能做到驱动数据中心节能;驱动服务器、存储网络的自动优化;驱动DCIM智慧运营,同时还能驱动自动巡检机器人;驱动NFV故障预测、自动编排以及5G网络优化。

第二阶段,人工智能能在数据中心中实现边缘与核心统一;实现AI各系统融合;实现AI产品标准化;实现全面物联网化。终极阶段是数据中心能在AI的参与下做到自我管理、自我修复、自我优化和无人值守。

“也就是说,数据中心为AI提供必需的计算能力,而AI应用改进数据中心自身。” 杨明川表示。

众所周知,运营商拥有大量的数据中心,但是要想智能化这些数据中心,面临的挑战也将非常巨大。人工智能是电信运营商在其网络从物理网络演进到基于数据中心的虚拟化基础构架NFV/SDN时必需整合的部分。

杨明川指出,对于运营商来说,智慧化数据中心主要面临以下五大挑战。第一基础设施改造。机架改造,异构兼容以及云管平台改造。第二,训练数据集,噪声庞大。第三,模型更新周期,训练迭代周期长。第四,通用人工智能平台,API接口与流程尚不规范。第五,智能化NFV编排器,尚难以替代人工决策。

“在智能化的数据中心方面的探索方面,中国电信主要依托于北京研究院的云计算实验室,中国电信以实验室的研究为基础,开展了智能化数据中心技术体系的探索,包括从底层芯片的架构到加速用SDK,从人工智能计算框架到不同业务的AI算法。” 杨明川介绍称。

中国电信首次引入基于人工智能的数据中心节能解决方案。基于深度学习网络建模数据中心不同业务的负载特征,发掘节能潜质高效合理地重组数据中心资源,以满足峰值时段和非峰时代,在非峰负荷期,触发业务迁移,将服务器置成“睡眠”,实现绿色节能。

“数据中心默认是按照峰值时段设计的,服务器是100%加电运行的,每个业务在一定的时间段内都有自己的使用类型,中国电信学习每个业务并发现绿色区域,这是业务的非峰时段。” 杨明川表示。

同时,基于深度学习网络建模数据中心不同业务的负载特征,基于数据中心业务层,物理基础设施层,机房环境层的历史数据自动学习与训练权重和偏置系数,将学习到的关联关系以及知识应用到数据中心控制调度器上。

另外,基于学习模型,负载服务器负荷,高效合理的重组数据中心资源,模型预测机制并能够根据过往业务波动规律,启动唤醒服务器处理峰值业务,预留20%的缓冲以应对无可预测的突发流量。

杨明川称,中国电信数据中心智能化节能是通过“纯软件+渐进式部署”,在保障业务质量的同时实现有效技能。此外,中国电信还发布了定制化服务器,2013年—2014年,根据网发部要求启动中国电信定制化服务器设计,测试验证与规模引入。2015年—2016年发布超融合定制化服务器和低功耗定制化服务器。2017年,新增NFV定制化服务器、新增GPU定制化服务器。2018年国产CPU服务器,发布边缘定制化服务器。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。