日前,一期全球高性能计算机(HPC)TOP500榜单在德国法兰克福举行的国际超算大会(ISC2019)公布。排在前四的超算分别为:
排在第一位的是美国超算的“Summit”;
排在第二位的是美国超算Sierra;
排在第三位的是中国的神威·太湖之光;
排在第四位的是中国的天河二号A;
可以说全球超算已经是中美竞赛的格局。在这份榜单中,由中国厂商研制的超算占据TOP500席位数超过300台(包括国内部署的国产超算和国外客户采购国产超算),从数量上看,已经形成“中国超过外国”的势态。
不久之后,美国把曙光和江南所等五家单位列入“实体名单”,称它们对美国的国家安全或外交政策利益构成风险。在没有得到美国政府豁免之前,实质上阻止了这些实体购买美国技术和组件。
透过现象看本质,美国这次制裁目的是遏制中国超算发展。
中国超算茁壮成长
因上世纪80年代奉行的政策使中国丧失独立自主研发制造计算机的能力后,美国政府严格限制对中国出口高性能计算机。
当时,高性能计算的应用涉及的基本是堪称国家“命脉”的领域,如国防军工、油气勘探、水电利用等。由于中国当时还没有自主研发的高性能计算机,所需要的计算机只能依靠进口,价格昂贵,维修管理困难。在1994年,中国进口计算机就花掉近20亿美元,维护费用动辄千万。
原石油工业部物探局曾花费巨资购买了一台国外的大型机,后期集成与维护的费用对方公司竟开出百亿以上的天价。不仅如此,对方还提出了一个让中国IT人铭记了十几年的屈辱条件——在设备使用过程中,为防止机器核心技术外泄,设备机房采用全透明的玻璃墙壁,中国使用人员的一举一动都在外国人的时刻监控下,甚至连高性能计算机的启动密码和机房钥匙都要由外国人控制!
为了彻底拆除“玻璃房子”,研发出完全拥有自主知识产权的国产高性能计算机,以曙光公司为代表的中国民族IT产业在走上了一条异常艰苦的自主突围之路。
90年代初,为了彻底打破国外对高性能计算机的垄断,国家派出一支年轻精干的科研小分队,远赴美国硅谷去搞曙光一号的研究。1993年,中国一台高性能计算机曙光一号并行机终于研制成功。曙光一号的战略效应可以说是立竿见影,就在这台高性能计算机诞生的第三天,美国便宣布解除10亿次计算机对中国的禁运。
1995年,在只有500万元经费的情况下,成功研发出曙光1000大规模并行计算机。曙光1000在整体技术上居中国之首,并达到了20世纪90年代前期的国际先进水平,其运行速度的峰值达到了每秒25亿次,在当时我国大规模科学工程计算中发挥了重大作用。曙光1000也荣获了1996年中国科学院科技进步特等奖和1997年国家科学技术进步一等奖。
1998年,曙光2000问世,总体水平达到了90 年代同期国际先进水平,有些方面如机群操作系统、集成化并行编程环境和服务器聚集软件等已处于国际领先水平。2001年,曙光3000诞生,标志着我国超算产品正在走向成熟,能兼顾大规模科学计算、事物处理和网络信息服务,已然是国民经济信息化建设的重大装备。
2004年,曙光公司研发出4000A,成为国内首台每秒运算超过10万亿次的超级计算机,并代表中国首次进入全球超级计算机TOP 500排行榜,位列第十位。
2008年,曙光5000降生,曙光5000的系统峰值运算速度达到每秒230万亿次浮点运算,使中国成为继美国之后第二个能制造和应用超百万亿次商用高性能计算机的国家,也表明我国生产、应用、维护高性能计算机的能力达到世界先进水平。
2009年,作为第一台国产千万亿次超级计算机天河一号在湖南长沙亮相。天河一号超级计算机性能为每秒1206万亿次的峰值速度,Linpack实测性能为每秒563.1万亿次,强劲的性能使天河一号位列中国超级计算机前100强之首,也使中国成为继美国之后世界上第二个能够自主研制千万亿次超级计算机的国家。
2010年,国防科大对天河1号进行了升级,使天河1A的实测运算能力从天河1号的每秒563.1万亿次,提升至2507万亿次,成为当时世界上最快的超级计算机。
2010年,曙光6000问世,曙光6000以实测每秒达1271万亿次的Linpack峰值速度,在2010年第35届全球超级计算机500强排名中名列第二。
2012年,神威蓝光超级计算机投入使用。该超算使用了8704片申威1600,搭载神威睿思操作系统,虽然超算绝对性能并不高,但却是中国在“市场换技术”之后,首次实现了超算CPU和操作系统的全部国产化。
2013年,国防科大成功研制出天河2号,其高达55PFlops的性能使其傲视群雄,六度蝉联TOP500排行榜首位。
2016年,神威太湖之光问世,这款超算实现了从CPU、操作系统、高速互联网络等核心软硬件的全面国产化——其CPU申威26010由260个核心构成,双精浮点峰值高达3TFlops,完全追平了Intel最好的超算芯片。得益于申威26010强劲的性能和良好的体系结构设计,新超算的双精浮点峰值超过100PFlops。
美国的目的在于遏制中国超算发展
诚然,神威太湖之光在峰值性能上已经被美国新超算Summit和Sierra超越,但这只是中美超算交替领先的一个片段,中国和美国都在致力于研发E级超算。
超算有一点非常特殊,那就是与国防军工、尖端科技联系非常密切,很多应用涉及的基本是堪称国家“命脉”的领域。由于尖端军事科技、情报分析、气象模拟等诸多方面都离不开超算。可以说,中国超算对于打破美国军事科技霸权有至关重要的作用。
这使得超算与一些被资本和媒体包装的名为黑科技,实为噱头的技术完全不是一回事。一旦在超算上落后于人,对于诸多命脉行业造成的影响是不容小觑的。
最近几年,天河与神威超算相继多年位居TOP500榜首。曙光则在商业化上比较成功,在2019年6月的TOP500榜单中,联想、曙光、浪潮,三家厂商入围数量共计307套。在TOP100榜单中,共有9套部署在中国地区的超算系统入围,从其研制的超算厂商方面来看,曙光与联想并列,均为3套。
根据《纽约时报》的报道,曙光是中国最重要的高性能计算机和服务器制造商之一。根据2018年中国TOP100排行榜,中国前20台超级计算机中,有10台是曙光制造的。这些强大的计算机为包括中国政府、电气预报、以及最大的技术公司提供服务。
《华尔街日报》援引美国商务部的裁决称:"曙光高性能计算机用于各种军事用途和终端",并补充说无锡江南计算技术研究院属于PLA,肩负着支持中国军队现代化建设的使命。
加上此前美国商务部就针对国内4家超算中心禁售芯片,其中,天河2号就受这次禁令影响,放缓了升级进度,之后用国内自主设计的矩阵系列加速器,替换掉了英特尔的加速器。
可以说,美国已经把矛头指向了国内神威、天河、曙光三大系列超算。
对于这一次美国把四家中国公司和一家中国研究所列入“实体名单”,铁流认为,对中国E级超算的有利有弊。
一方面,在超算最关键的几项技术,其实国内都有不错的储备。比如超算芯片,SW的芯片性能非常厉害,在SW26010的制造工艺落后于英特尔同时期超算芯片2代的情况下,具备同水平的双精度浮点运算性能,而且是自主指令集+自主设计,只要国内提供稳定流片渠道,就基本没啥问题了。
又比如互联网络,科大在互联方面有比较深的技术积累,天河2号的互联就是中国标准+中国自主设计,就性能来说,在天河2号问世的时候,这个互联是国际顶尖水平的。
曙光在液冷技术上有自己的方案,特别是在应用和商业化方面,曙光相对于天河、神威超算有明显优势。如果把国内超算力量整合到一起,美国这次打压中国超算的举动,反而是整合国内资源的契机。
另一方面,我们也不能妄自尊大,虽然在超算芯片、互联等关键技术上,国内能够解决,但在一些局部,或多或少还要用一些国外技术。业内人士就表示:没人敢保证不会用到美国技术。因而美国的制裁或多或少会产生一定影响。铁流认为,这次制裁无法扼杀中国E级超算,但可能会影响中国E级超算的进度。结局可能类似于上次美国针对四家中国超算中心——延缓了天河2号升级进度,但无法阻止中国超算技术进步。
在美国明目张胆打压中国超算的情况下,国内应对整合资源,查漏补缺,力争在E级超算的竞争中不落后于人。
据公开报道,中国E级超算估计在2020年后会问世。
据小道消息,会有三个方案。
神威依然是采用SW芯片。
天河三号会用飞腾的ARM芯片做任务管理,用矩阵系列芯片做加速器。
曙光也有自己的方案。
道路是曲折的,前途是光明的,相信随着中国E级超算的问世,中国超算又将在TOP500刷榜。
「 支持!」
您的打赏将用于网站日常运行与维护。
帮助我们办好网站,宣传红色文化!