陈鹏:中国超级计算机能否领跑世界

陈鹏:中国超级计算机能否领跑世界

6月21日,在号称超级计算机世界的奥运盛典——国际超级计算机“TOP500”最新公布的排行榜中,我国的神威∙太湖之光蝉联第一,天河二号继续保持第二。而美国的泰坦败给瑞士的代恩特峰,列居第四。

总体而言,全球超级计算机领域呈现出中美两强相争的格局。在6月的榜单中,从入选榜单的总数来看,中美两国共占据全球总数的65.6%,美国入选169个,中国入选159个。从入选的公司角度来看,中美两国的公司位居前列,且出现犬牙交错状。入选数量前七位的公司分别为美国的惠普、中国的联想、美国的克雷、中国的曙光、美国的IBM、中国的浪潮、中国的华为。

毫无疑问,中国的超级计算机走了一条“超级计算”的道路,在过去20年里,“超级计算机”运行速度提高了5000多万倍,与国际常规的20年100万倍相比,超出50倍数。傲人成绩的取得,有如下几点原因。

第一,超级计算机的发展离不开国家层面的重视和战略上的持续支持。从上世纪90年代初开始,在863重大专项中引入高性能计算以来,一直到目前的科技重大专项中的“高性能计算专项”,中国一直都将超级计算机作为国家优先发展领域,给予了重点关注和持续投入。与此同时,在超级计算机的政策支持方面形成了中央与地方政府联动的局面,北京、上海、天津、江苏、广东等地方政府对超级计算机及相关产业给予了非常大的支持。

第二,超级计算机的发展得益于坚持自主可控的战略部署。当我国超级计算机赶超美国之后,美国开始对我国进行技术封锁。2015年2月美国商务部的“芯片限售”就是对“天河二号”的钳制。美国的这种做法并没有影响我国超级计算机的发展,2016年6月,基于我国国产自主CPU的神威·太湖之光勇夺全球超级计算500强冠军,与“天河二号”一起领跑全球超级计算机。整体而言,从当初完全依靠国外技术,到核心部分的国产化(天河系列实现70%国产化,神威蓝光实现85%以上),再到如今完全自主的神威∙太湖之光,中国超级计算机在自主可控方面取得了历史性的突破。此外,基于申威、飞腾、龙芯等自主可控的高性能CPU,我国的超级计算机分别部署了神威、天河、曙光三条自主发展路径。

第三,超级计算机的发展关键在于协同创新。我国的超级计算机领域之所以取得今天的成就,协同创新是关键。从我国第一台巨型计算机“双向量阵列”结构,曙光一号“对称式体系架构”到银河系列巨型机“大规模可扩展共享存储体系结构”,再到“天河一号”超级计算机“CPU和GPU异构融合体系结构”,体现了我国超级计算机领域一系列的科技创新实践。目前,神威·太湖之光的性能指标Rmax(Rmax指的是linpack实际测试中达到的最大性能)超过90P(1P=230)次浮点运算/每秒,而美国泰坦的性能指标Rmax仅仅高于17P次浮点运算/每秒,也就是说神威∙太湖之光的Rmax是泰坦的Rmax的5倍以上。之所以能够达到如此高的性能,太湖之光在CPU内核、并行处理架构、能耗管理等方面都取得了综合性创新突破。应该说,作为一个高度复杂、高度集成、高度精密的重大设备,超级计算机的创新需要的是协同创新:CPU与体系架构的协同、操作系统等软件与超级计算机硬件的协同、应用与超级计算机系统的协同和效率与能耗的协同等。

虽然取得了重大突破,但我国的超级计算机要想真正领跑世界,还面临着许多问题。

其一,目前,全球超级计算机领域都将实现E级超级计算机作为一个关键里程碑。1996年ASCI Red系统首次突破1T次浮点运算/每秒(T级),2008年Roadrunner系统第一次达到了1P次浮点运算/每秒(P级),谁能率先夺取E级计算这一顶皇冠,成为当今超级计算机领域相互竞争的一个主要目标。虽然我国在实现E级高性能计算机方面具有比较好的基础,同时也制定出在2020年首次突破E级计算的目标,然而真正实现E级计算,在体系结构、计算、存储、网络、系统软件、系统冷却和可靠性等方面都存在关键技术需要攻克。

其二,美国政府一直在防范并阻碍我国超级计算机领域的发展。2002年,我国高性能计算机在全球几乎“名不见经传”,到2013年,“天河二号”问鼎全球超级计算冠军,仅仅10年的时间,让全球为之惊叹,同时也让美国措手不及。美国首先采取的是封锁,2015年美国明令禁止对我国高性能计算相关机构的芯片销售。在“卡脖”战略未见成效之后,美国国防部、能源部等政府机构组织过多次专题会议研究如何保持美国在高性能计算机领域的领先优势,甚至从国家安全的角度,分析中国的高性能计算对美国国家安全所带来的威胁和挑战。基于对我国的研究和分析,美国政府正在出台各种相应政策和措施并逐步实施,例如:近期,美国能源部组织AMD、Cray(Titan的开发商)、惠普(HPE)、IBM、英特尔和英伟达等6家公司,投资2.58亿美元,与中国在E级超级计算机领域展开角逐。

其三,高性能计算的应用与服务问题。实事求是来讲,相比于在高性能计算机方面取得的重大突破,我国在高性能计算应用与服务领域的成效相对不足。虽然,神威·太湖之光依托“全球大气非静力云分辨模拟”“高分辨率海浪数值模拟”和“钛合金微结构演化相场模拟”三个重大应用获得戈登·贝尔奖,部分应用性能达到了30- 40 PFLOPS。但从整体而言,我国高性能计算应用与服务和我国高性能计算本身的发展还是不相符的。尤其是在针对于国防安全、人工智能、大数据应用等解决重大国计民生问题的技术应用服务上,高性能计算机作为“国之重器”,应该发挥更加重大的作用。

无疑,当今世界已经进入网络空间和物理空间融合发展的新信息时代,计算机与软件本身在国防、经济、社会等诸多领域中扮演着越来越重要的作用,国际竞争越来越多地依赖于计算能力的竞争上,谁能够“算”得快、“算”得准,谁就能够把握先机,赢得胜利。作为最为重要的信息基础设施,高性能计算机是当之无愧的“国之重器”“国之利器”,目前我国的高性能计算机已经取得显著而可喜的成绩,然而,“路漫漫其修远兮”,在当今全球异常激烈的竞争格局下,要想保持我们的优势,要想再创辉煌,仍需要政府、科研机构以及应用单位继续努力,协同、融合发展,才能真正实现中国超算强国之梦。

责任编辑:刘佳星校对:郭浩最后修改:
0