听云CTO亮相《人工智能和大数据应用高峰论坛》,浅谈听云AIOps

10月24日,由国内知名IT高管社群——IT东方会举办的《人工智能和大数据应用高峰论坛》在北京举行,共同探讨人工智能和大数据的发展与挑战,分享新基建背景下AI和大数据技术应用创新实践。听云CTO陈靖华参与圆桌讨论,与其余几位专家一起探讨新基建形势下的人工智能和大数据应用。

听云CTO亮相《人工智能和大数据应用高峰论坛》,浅谈听云AIOps

目前,国家在大力倡导和推进AI新基建企业的数字化转型,陈靖华表示:AI的新基建应该包含从底层到上层的一些应用,最底层可能包含AI的算法,上面的芯片技术最终可能是提供AI这部分的算力以及基础设施,再往上我们所用的这些,比如基于开源的,或是基于商用的AI开发框架,这部分可能是AI新基建这部分底层需要去提供的一些能力以及建设的一些内容,但是最重要的还是它上面AI应用在不同的行业不同的场景下的情况,这部分跟每个人或者是跟每个最终用户直接相关的部分。

听云CTO亮相《人工智能和大数据应用高峰论坛》,浅谈听云AIOps

陈靖华说:“这几年随着数字化的发展,实际是云的发展变革,基本上所有的企业可能都把原来的IDC搬到云上,云上的这些资源可能会从原来的虚机变成容器,其实云变得容器化以后,就让以前的运维会变得非常难,特别是在应用上的运维,我们过去几年一直是在做APM,APM目的就是帮助用户在性能出现问题的时候,快速能去定位到问题。从原来的几天缩短到几分钟,但是随着云资源的快速扩张以及应用部署,比如说部署在docker容器里面容器化以及应用的微服务化,从原来单体的应用变成了一个非常多调用链、非常复杂的一个应用,在这个场景下再去用原来基于人肉或是基于统计学的一些数据分析,就很难在出现故障,或是在性能出问题的时候去定位到问题。

这些也就是为什么听云这几年一直在做AIOps的原因。过去的几年里,我们逐渐从APM转向AIOps,它其实是利用了AI的能力去帮助运维人员和研发人员,在应用出现问题时,能快速的识别发现,同时能够对问题进行快速定位,究竟是硬盘上问题,还是一个应用代码写错了的问题,在Gartner的技术成熟度的曲线上,AIOps还属于上升期。而APM已经到了缓慢的光明期,它已经成为了一个比较成熟的技术。AIOps在现阶段来说,对整个行业还是比较新的技术。听云现在可以做到对一些指标的异常监测,我们的应用系统里面可能会有很多服务器、硬盘、CPU、内存等等,这些对我们来说都是不同的持续指标,以前对持续指标监控的时候,需要运维人员去设一个预值,比如说超过这个值进行告警,但是现在已经变得越来越不可能,因为我们要告警的指标太多了。不可能每个去预设,并且这些波动实际上是有一些受到业务或网络波动影响,可能会出现一些规律。所以现在我们能做到的是不需要去设任何的预值,我们可以利用AI的算法去做异常监测,当数据波动在AI算法里面识别出异常的时候,可以快速告警,并且告诉我们几千万个指标里边有一些指标是密切相关的,因为它们会互相影响,比如说一个硬盘,最终影响到了一个它上面的数据库,数据库的性能下降又影响到了核心业务,最终导致的业务量的下降,这几个指标之间是有非常密切的相关性,如何在千万的指标里面快速把这几个指标找出来,这就是我们目前在做的一个落地的场景。”

讨论会上,陈总就新基建背景下AI的发展表达了自身的看法,并且对于AIOps发展趋势进行剖析。目前,听云大力发展AIOps的建设,在C轮融资后,更是持续增加研发投入,逐步加强和升级数据的采集、加工以及针对不同行业进行有效输出的能力,重点提升AIOps产品能力,并通过不断完善和发展的市场营销服务交付给客户,真正体现用户价值。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )