“东数西算”时代,海量数据谱写国产数据库新篇章

数字经济时代,数据成为了推动社会发展的生产关键要素和重要战略资源。据国际数据公司、中商产业研究院最新数据显示,中国的数据产生量约占全球数据产生量的23%。不过,国内数据中心市场存在一定程度的供需失衡,算力成本尚不能有效满足普惠发展的需求。为了在数字时代赢得大国间的科技竞争,织就一张高效“算力网”,2022年我国全面启动了“东数西算”工程建设。

今年2月,国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。我国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式启动。

“东数西算”工程全面启动

“东数西算”中的“数”指数据,“算”指算力,即对数据的处理能力。算力如同农业时代的水利、工业时代的电力一样,是数字经济发展的核心生产力,是国民经济发展的重要基础设施。

图注:数据和算力,是数字时代的重要基础设施

“东数西算”工程每年带动的投资约4000亿元,通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部密集地区的算力需求有序引导到西部,使数据要素跨域流动,优化数据中心建设布局,促进东西部协同联动,助力我国数据中心绿色低碳水平的提升。

在“东数西算”工程中,数据库是为整个算力网络提供基础支撑的核心底座,其中数据的存、算、管、用,都离不开数据库的支撑。可以说,数据库是开启数据资产宝库的金钥匙,是基础软件皇冠上的明珠。

“东数西算”工程意味着,数据要素需要大规模、跨地域的流动,还要满足金融证券、工业互联网、灾害预警、智慧城市“大脑”、政务等宏大的关键业务应用场景需求,这些都对数据管理的高并发、低延时、高可靠、高安全等提出了严苛要求,例如热点数据的高性能存取、数据存储的安全保障以及在满足“算网共生、智能编排”的架构要求上,如何更有效地降低存储成本和能耗等。

海量数据聚焦数据库、数据计算、数据存储产品与服务,是国内首家主板上市的数据库技术领航企业,业务覆盖全国30多个省和直辖市,设立了华北、华东、华南、华中、西南、西北、东北7大售后服务中心,为2000多家大中型行业翘楚提供数据技术解决方案。在“东数西算”工程正式启动后不久,海量数据作为“东数西算”的核心概念股而广受关注。

海量数据为算力网络提供数据库核心底座

在“东数西算”工程中,对数据库的部署有几点共性需求。

一、“东数西算”处理的数据量巨大,要求满足高并发能力。据国家发展改革委发布数据显示,截至今年4月,在全国10个国家数据中心集群中,新开工项目25个,数据中心规模达54万标准机架,算力超过每秒1350亿亿次浮点运算,约为2700万台个人计算机的算力,带动各方面投资超过1900亿元。

二、其次是对低延时的要求“东数西算”工程要重点推动东数西存(热点区域数据计算、西部备份存储)、东数西训(东部算法仓库、西部离线大数据分析),将实时性要求不高的业务如文档云、掌上保险、开发测试等应用部署在西部节点,促进数据中心集约化、集群化发展。数据要素的跨域流动,涉及到长距离的数据传输和调用,除对网络速度提出了较高要求外,对数据库的低延时、快速响应同样提出了高要求。

三、“东数西算”工程关乎国家数据安全,不仅要选对面向未来的技术路线,同时要保障全栈技术自主可控。

相较于国产数据库赛道上的其他选手,海量数据从技术实力、产品性能、生态伙伴等各方面,拥有综合比较优势。

第一,从技术实力层面看,海量数据在数据库领域积累了15年经验,公司自2007年成立至今,始终坚持自主技术研发和创新,拥有国内顶尖研发团队,技术人员占总员工人数的60%,其核心技术人员大多来自于国际主流数据库厂商。

目前,海量数据在北京、广州、南京、天津、西安、成都设立了6大研发中心,技术精英占比超过65%,核心技术人员大多来自于国际主流数据库公司人员。同时,公司设立了华北区、华东区、华南区、华中区、西南区、西北区、东北区7大业务服务中心,覆盖30个省会及直辖市,为2000多家大中型企业客户提供数据技术解决方案。

第二,从产品层面看,海量数据的产品线包括了Vastbase数据库、Vastcube数据计算、Vastorage数据存储系列。其中,海量数据库Vastbase实现了从架构到引擎等多维度的优化,拥有NUMA架构性能优化、线程并发、CSN事务快照、增量检查点、AI原生、SQL-Bypass六大技术,体现在海量数据库中,就表现为高性能、高并发、高可用、高安全、高兼容、多模态的“五高一多”产品特性。

尤其在高性能方面,海量数据库表现优异。根据国内权威软件评测机构——中国软件评测中心测评结果显示:在两路鲲鹏服务器下,海量数据Vastbase2.0版本可以达到139万的tpmC值;Vastbase2.2版本可以达到154万tpmC值,这是一个表现相当令人惊艳的数字。另外,海量数据库在鲲鹏四路CPU的服务器环境下测试,取得了260万以上的tpmC值。

在高可用方面,海量数据库实现了RTO极致性,以海量数据库在客户比亚迪中的部署为例,实现了RPO=0、RTO<10s的指标,在数采同步等业务模块中,其整体性能较原系统提升了50%。

第三,从自主可控的技术路线看,海量数据库Vastbase G100是基于openGauss内核推出的自主品牌产品。openGauss具备独立演进能力,是华为公司集合了全球11国专家智慧推出的产品,它的源代码放在中国,实现了完全的自主可控,同时建立了健康、繁荣的生态体系。基于以上多种因素,openGauss是面向未来的数据库主流技术,已经成为行业共识。

海量数据是openGauss社区理事会成员单位,在该社区的内核贡献排名第二。海量数据的研发费用从2017年的2520万元,提高至2021年的7361万元,年复合增速高达30.73%,同期研发费用率自4.86%提高至17.5%,处于行业领先水平。

在生态伙伴方面,截止2021年,海量数据与176家企业达成了生态合作伙伴关系,生态适配中的产品达到312件,产品证书共颁发218个。海量数据先后服务于多家全球500强企业,为数千家大中型行业用户提供产品和服务。

作为数据库技术的领航企业,海量数据将秉承“专注做好数据库”的初心,不断发挥产品和技术优势,积极参与“东数西算”工程建设,为各地算力枢纽节点和数据中心提供高性能、高安全、高可靠的数据库产品、服务和解决方案,助力“东数西算”工程打造数字新基建,促进东西部地区数字经济的平衡发展。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )