咪咕视讯“搬家”启示录:openEuler或成数字基建最优解

不管是现实之中,还是虚拟世界,搬家从来都是劳神耗力的大工程。不过,随着技术的发展,系统搬家正在告别兵荒马乱的时代。

这一观点并非空穴来风。就在上个月,操作系统大会 & openEuler Summit 2023在京召开,咪咕视讯斩获2023年度openEuler领先商业实践奖。获奖项目正是公司规模浩大的操作系统迁移实践。

image001.jpg

作为体育内容服务商,咪咕视讯旗下“咪咕视频”、“移动高清”等产品已经实现了全场景覆盖。一直以来,也因其出色音视频能力,深受用户认可。面对操作系统迁移的巨大工程,咪咕视讯依旧延续了高画质、高音效、高安全、低时延的稳定用户体验,更是通过了亚运会直播的重大考验。

如此丝滑的云搬家到底是靠什么实现的?openEuler便是背后的“神秘武器”。

颠覆“船大难掉头”

要理解openEuler的强大,就要先了解咪咕视讯“搬家”的难度。

咪咕视讯成立于2014年,是中国移动咪咕公司旗下唯一聚焦于视频运营的实体单位。经过9年多的发展,咪咕已经成为视频内容领域和体育赛事内容领域的企业,也是国内首个聚齐足篮排“三大球”顶级赛事、国内唯一聚齐欧洲足球五大联赛的体育内容平台。

这意味着系统不光要承受高强度的直播和内容传输,还要应对重大赛事带来的突发数据冲击。以2022年卡塔尔世界杯为例,咪咕视频作为持权转播商,实现了仅11月用户规模同比增长就高达103.55%。在剧烈的数据波动下,保证平稳运行已经很有挑战,要同步实现系统迁移更是难上加难。

特别值得一提的是,临近年底,多个互联网头部平台出现崩溃,成熟系统的运行中尚且有如此意外,对于咪咕视频这种巨无霸量级的项目,搬家更是如履薄冰,稍有差错可能就会造成无法挽回的事故。

既然有风险,咪咕视频为何还要搬迁系统?据了解,咪咕视频现网服务器主要使用的是CentOS/RHEL操作系统,而该系统已于2021年12月31日停服,严重威胁到咪咕视频系统的连续性。为保障现网业务的稳定与安全,替换操作系统迫在眉睫。

与此同时,由于咪咕视频资源池使用多年,总体资源可分配余量已无法满足新项目需求。而且现有资源利用率较低,通过管理手段也难以扭转,咪咕视频迫切需要通过平台技术革新来全面提升资源整体利用率。操作系统搬迁叠加系统升级的需求,似乎不可完成。

方法总比困难多。面对难但必须做的项目,前沿技术给出了可行方案,让充满凶险的系统迁移之路变得更加平稳。针对操作系统迁移,咪咕视讯团队从自主创新考虑,锁定了国内开源社区的操作系统openEuler(欧拉)。

公开资料显示,openEuler是面向数字基础设施的全场景开源操作系统,基于 Linux 稳定系统内核,以高可靠、高安全以及高保障著称。在功能和性能上,咪咕团队分别对欧拉进行专项测试验证,证明openEuler可替换CentOS,从而决定迁移至openEuler。

与openEuler社区团队充分交流后,咪咕视频采用了x2openEuler与原地升级技术的迁移解决方案。同时,咪咕视频结合特有的双机房、双活及容灾系统优势,形成了不停服敏捷部署方案。利用多系统多团队并发任务有序推进的项目管理方式,团队从技术、方案和项目管理多管齐下,实现了系统迁移和用户体验不降级的“双达成”。

“船大难掉头”正在被技术颠覆,咪咕视频的 “搬家”效率惊人。截止2023年底,已经累计迁移上量2.2万套openEuler系统。业务系统覆盖咪咕视频(包括超高清直播、多屏互动等)各类关键业务系统,并经历2023年亚运会直播、录播等重大活动,覆盖海内外3.6亿用户。

迁移升级降本“一箭三雕”

平稳迁移只是openEuler方案的一个侧面,系统升级和降本增效同样引人注目。

在openEuler操作系统替换过程中,咪咕视讯联合欧拉社区,定制了针对咪咕视讯业务的操作系统一键式升级工具,有效提升了咪咕视频的操作系统替换效率。据统计,咪咕视频通过迁移和新应用系统部署,其业务的性能部分提升超10%。

值得一提的是,该方案选择了云原生混合部署方案,以提升集群应用密度与资源利用率,从而实现降本增效。首批选择了针对在线业务视频门户与离线任务点播转码,在Ocean平台开展混合部署。系统还引入混合部署引擎rubik,该引擎可以减少资源争抢,做到资源隔离保证业务之间无影响,在保证业务正常运行的情况下,让资源得到充分复用。

同时在集群调度层面,咪咕视讯还开发了统一调度器CA(Cluster Autoscaler)来满足业务的混合部署,增强集群调度能力。该调度器根据业务负载情况、以及自研算法来完成混合部署,达到资源的复用。现网运行效果显示,预计可为企业节省服务器数百台、降低服务器采购成本数百万。

咪咕视频项目负责人表示,除了日常的生产环境的运行维护,降本增效一直是后端运维部门的重点工作。通过自研的全局混合调度器CA,与openEuler社区容器混合部署引擎Rubik的紧密结合,咪咕视频实现了视频门户和视频转码在离线业务的混合部署,成功将本地资源的CPU利用率提升到50%以上,且关键业务效果还不受影响。

例如在2023年亚运会保障中,该方案表现优异,平台稳定,性能可靠,期间平台无任何故障发生。结合openEuler在咪咕视频内部的操作系统迁移实践,预估在2025年前,咪咕视频就能够完成现有业务的全量系统迁移。

在大型赛事保障中的优异表现,不仅证明了在互联网视频场景下,openEuler操作系统具备规模化推广上线的能力,同时也展现了“多效合一”的应用逻辑。大多数时间里,一个业务动作只能实现一个效果。而在咪咕视频系统迁移的项目中,系统升级、降本增效与系统迁移同步完成,实现了“一箭三雕”。

在openEuler技术框架下,“一举多得”成为标配,引领了数字基建的新趋势。

“值得信赖”的滤震器

安全迁移的背后,运维服务是关键。

联合创新意味着新的突破和尝试,如何将这些变化控制在安全范围内是门技术活。以咪咕视频迁移系统到openEuler为例,出现问题是不可避免的。重要的是系统运维力量能否将问题扼杀在产生伤害之前,及时将迁移的震动过滤掉。

目前,咪咕视频完成了全部业务跟openEuler的适配,并且超50%的系统也已迁移部署到openEuler上运行。在这个实践过程中,专项组发现问题的第一时间,就跟社区团队即时反馈。并通过与社区x2openEuler技术团队的联合创新,共同构建了咪咕视讯内部使用的业务迁移解决方案,并生成了可复用的辅助升级工具。

针对系统迁移项目,openEuler跨基础架构运维和应用运维团队抽调一线运维技术骨干工程师成立专项团队,分别按业务系统、分批适时迁移。正是因为运维服务能力的协助,系统整体迁移过程才能平滑进行,未造成任何生产故障,业务侧零感知、零投诉。

对于项目最具价值的收获,非方法论莫属。在咪咕视频系统迁移项目的运维过程中,专项团队还将实践经验、发现问题系统总结,并将对应的迁移方案和解决方法汇总,形成咪咕视讯自己的经验知识库和方法论储备。

大众往往在系统的创新上投注了过多的注意,反而忽视了全周期内的运维服务能力的重要性。在咪咕视频系统迁移的项目中,openEuler创新之外,“稳”的能力同样突出,值得合作伙伴信赖。

咪咕视频携手openEuler,实现丝滑“搬家”不过是行业脉动的一个缩影。从更宏观的视角审视行业,迁移升级降本“三位一体”也只是道开胃菜。在未来,共创共赢模式驱动之下,一切皆有可能。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2024-01-17
咪咕视讯“搬家”启示录:openEuler或成数字基建最优解
如此丝滑的云搬家到底是靠什么实现的?openEuler便是背后的“神秘武器”。

长按扫码 阅读全文