南京大学为什么要建那么大一个HPC集群?

摘要:作者|于泽(大数网副主编)去芜存菁微信|YL09092014深入到实际案例中,发现攻下每一个客户都不容易。只有不断地重复这种不易,才能使你变得伟大。6月30日,2017联想全球超算峰会(2017Len

作者 | 于泽 (大数网副主编)

去芜存菁 微信|YL09092014

深入到实际案例中,发现攻下每一个客户都不容易。只有不断地重复这种不易,才能使你变得伟大。

6月30日,2017联想全球超算峰会(2017 Lenovo HPC Summit)即将召开。而在此之前的6月27日,一场小规模的研讨会率先在南京上演。主角是谁?南京大学和联想。

联想集团数据中心业务教育行业总监蔡斯扬致辞

看起来这可能只是联想高性能计算(High Performance Computing,HPC)在教育行业的一个具体案例,但折射的其实有很多。比如,南京大学为什么有代表性,教育行业在HPC领域的应用情况如何,为什么南京大学最终选择了联想、被其哪些方面打动等。

南京大学-HPC高教范本

一个一个来,由小到大,先说南京大学这个案例。

大背景是南京大学理工科非常强,八个国家一级学科,中国语言文学、数学、物理学、化学、天文学、地质学、生物学、计算机科学与技术学中,有七个都需要大量的运算。有了这个前提,不难理解为什么南京大学的HPC历程可以追溯到那么早。

2001年,南京大学开始投资建设高性能计算中心,这也是中国最早一批高性能计算中心,后历经2005年、2007年先后立项扩建;2009年,新建高性能计算中心,并在当年的中国高性能计算机性能TOP100排行榜列第七位,高校系统第一位。2015年,南京大学高性能计算中心的扩建再次提上日程。

截止当前,南京大学高性能计算中心改造升级项目已经结束,并正式投入运营。

南京大学高性能计算中心一角

看两组数据,一是Linpack峰值(理论计算速度),它直接反映的是系统的性能,升级前的南京大学高性能计算集群(以下简称“一期”)Linpack峰值为每秒34万亿次,升级后的(以下简称“二期”)是844.8万亿次,是一期的近25倍。

二是系统规模,一期共402个计算节点,每节点12GB内存、2颗至强处理器,存储是128TBSAN加上54TB并行存储;二期呢?880个计算节点,每节点2颗至强处理器,内存有两种规格64GB和128GB,存储是2PB的SAN加上超过1.2PB的并行存储。

结合两组数据能发现很多东西,比如二期规模看起来似乎只比一期翻了一倍,但性能却差近25倍,可见八年间信息技术发展之迅猛。

与此同时,南京大学对高性能计算资源的需求增长之快可见一斑。南京大学高性能计算中心副主任董锦明在接受采访时表示,扩建后高性能计算中心的负载率目前在1/3左右,但他们预计一年后,就会达到80%。这并非盲目的乐观,他解释说,之前由于资源不足,很多老师都在外寻找计算资源,同时他们也拒掉了很多兄弟院校,以及企业的申请,把这些都算上,很快就会再次进入资源相对紧张的状态。

这是南京大学HPC方面的一些情况,从根本上说,他们升级是因为资源不够用了。而这很有代表性,足以体现行业趋势,那就是高校对HPC需求量大,而且越来越大。

广深交织-需求日益增加

为什么高校会有如此大的需求量?从更高的层面看,一、当下是数据社会,数据量正越来越大、再加上人们对数据分析效率的追求越来越高,这需要更为强大的计算力,二是信息技术这些年取得长足进步,使得HPC的获取变得简单、容易,之前需要大量的人员、资源投入,现在以极少的代价就能享受其强大的能力。

聚焦高教,就如南京大学的情况,需要借助HPC的学科越来越多,越来越深。举个例子,车辆设计需要HPC,但很多基础的研究并不在汽车制造公司,比如材料、分子等。在哪?在高校、在研究所。车辆设计只是HPC应用的一个门类,但高校覆盖的是各个学科,物理、化学、生物……连接的是各行各业,因此可能高校HPC在某一领域的应用深度比不上产业,但广度绝对超过所有单一行业。

这是其一,高校科研涉及领域广泛,需要HPC的地方多。其二,随着研究的不断深入,追赶国际领先水平脚步的日益加快,高校在单一领域对HPC的需求量也会与日俱增。

这可以理解为当前高教领域对HPC需求的现状,需求量大、重视程度日益增加,这一点从南京大学身上也能看出。

除此之外,事实上,从另一个侧面也看出这一点,那就是建设高性能计算中心的院校越来越多,这几年仅联想实施的就有北京大学超算中心、厦门大学化学化工学院超算中心、青海大学水利工程超算中心和南方科技大学新能源超算中心等十数个,HPC在高教行业的发展速度可以想象。

联想HPC-它们的一致选择

为什么这么多院校会选择联想作为合作伙伴,联想打动他们的是什么?南京大学的案例或许能解释其中的缘由。

南京大学高性能计算中心副主任周庆林教授

南京大学高性能计算中心副主任周庆林教授在采访中谈到了两点:一、先入为主,南京大学高性能计算中心上一套系统是IBM的,用的很好,稳定、可靠,而联想收购了IBM x86服务器业务,没理由不继续使用。

二、联想的实力,尤其是在高性能计算领域的实力。连续多年国内HPC TOP100排行榜榜首,连续多届国际HPC TOP500第二,不用再细说技术能力、服务能力,这些成绩已经说明了一切。

除此之外,他还讲了一个小插曲,一个国际知名厂商已经买了标书了,最后投标却没来。他猜想可能还是满足不了南京大学的需求,可能是技术能力不足,也可能是实施能力不够。

实际上,就如周庆林所分析的,技术实力跟联想差不多的,服务能力未必跟得上;服务能力够的,技术能力又不一定行。最终多方权衡,联想是最好的选择。

当然,他们的选择绝对是对的,联想绝对有能力担负起大家的期待。作为中国最早做HPC的厂商,联想有足够的积淀,并且在收购IBM x86服务器业务后,这些能力获得进一步增强。

看看联想在HPC领域的布局,深腾X8800解决方案、水冷技术、LiCO智能超算平台……再加上全球化的专业团队,覆盖应用调研、方案设计、方案论证、应用测试和优化、现场安装和实施端到端,以及开放心态下紧密无间的合作伙伴,其有今天的成绩一点都不意外。

面向未来,联想还在不断的进步,更好支持AI人工智能)的LiCO平台、很快就要发布的Think System服务器产品线、团队进一步的调整细化。据说30号还会有重大发布……一切为了客户,明天自然不会差。

采访手记

没人能随随便便成功,4500万大项目的背后,是双方无数次的沟通交流、是很多人没日没夜的加班加点。就如联想集团苏皖大区DCG业务总监郝飞所透露,服务这个项目的一个20人的团队最忙的时候,十天时间平均每个人只睡一天。对此,周庆林他们笑笑说,我们真没少提要求。

再想想联想做了那么多这样的项目,于是我写下了开篇的第一句话。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2017-06-30
南京大学为什么要建那么大一个HPC集群?
摘要:作者|于泽(大数网副主编)去芜存菁微信|YL09092014深入到实际案例中,发现攻下每一个客户都不容易。只有不断地重复这种不易,才能使你变得伟大。

长按扫码 阅读全文