1
新一代神威超算性能强劲
在过去十年中,全球超算发展迅速,中国、美国、日本呈现你追我赶的架势,中国的天河2号、神威·太湖之光,美国的前沿、顶点,日本的富岳都曾经位居TOP500第一位。其中,中国的天河2号连续6次雄踞TOP500榜首,神威·太湖之光连续4次占据TOP500榜单第一位。
2019年2月25日,国防科技大学计算机学院计算机研究所科研人员在天河机房测试“天河二号”超级计算机系统。图|新华社
TOP500前10名不断变化,根本原因正是半导体技术发展迅速。由于超算芯片设计水平和芯片制造水平飞速发展,各国拥有了性能更强的超算芯片,拥有了更强的互联网络,于是,性能更强的超算应运而生。
以2016年发布的神威·太湖之光为例,当时其性能为100P位,居全球第一,而不过短短6年,如今的E级超算性能已经是神威·太湖之光的10倍。
本次美国超算前沿在基准测试中跑出了1.012百亿亿次(1000P)浮点计算速度的峰值实测性能,成为了世界上第一台官方认可的E级超级计算机。
事实上,今年我国的新超算并没有公开,也没有向国外机构提交成绩,自然也就没有参与TOP500排名。英国《金融时报》也发布报道称,中国首台E级超算已经运行一年多,只是没有参加排名,“中国企业现在更专注国内竞争,而不是国际对手在做什么”。
根据披露的公开信息,新一代神威超级计算机的计算能力由自主研发的多核SW26010P CPU提供。虽然SW26010P CPU的具体参数我们无从得知,但2021年中国高性能计算机性能TOP100排行榜上有一款基于SW26010P打造的超算,我们可以基于这台超算一探究竟。
2021年中国高性能计算机性能TOP100排行榜(截取了前10名)。图源:中国计算机学会高性能计算专业委员会
从榜单显示的信息看,该超算仅用了992片SW26010P芯片,就打造出一台13.9P的超算。作为参照,神威·太湖之光性能为125P,使用了40960片SW26010芯片,换算一下,SW26010P的性能相对于SW26010提升了5倍。更为可怕的是,这台超算效率极高,达到90.3%。作为参照,TOP100榜单上前20的超算,除神威·太湖之光效率达到74%外,其余超算效率在46%至62%之间。
而早在2021年,新一代神威超算就有“千万核可扩展第一性原理拉曼光谱模拟”“多架构大规模并行保辛结构电磁全动理学等离子体模拟”和“超大规模量子随机电路实时模拟”三项应用入围“戈登贝尔奖”。最终,中国的超算应用团队凭借应用“超大规模量子随机电路实时模拟”,获此殊荣。
这里要介绍一下“戈登贝尔奖”。该奖项设立于1987年,是国际上高性能计算应用领域的最高学术奖项,主要颁发给高性能应用领域最杰出成就,被称为“超算领域的诺贝尔奖”。
此前,“戈登贝尔奖”曾被美国和日本垄断近30年。直到2016年,基于神威·太湖之光超算的“千万核可扩展全球大气动力学全隐式模拟”荣获“戈登贝尔奖”。2017年,基于神威·太湖之光超算的“非线性大地震模拟”再获“戈登贝尔奖”。加上2021年这次获奖,这已经是基于神威超算的应用第三次获“戈登贝尔奖”,彰显了中国超算和超算应用的实力。
此外,新一代神威超级计算机进行了RQC(随机量子电路)高性能实时模拟,可扩展到4200万个核心,单精度浮点性能可达120亿亿次,混合精度性能可达440亿亿次。我国联合科研团队基于新一代神威超算用304秒完成了百万高保真度的关联样本,为未来量子计算的发展提供了坚实的模拟支撑。
2
七十年前的高瞻远瞩
中国超算之所以能够突飞猛进,很大程度上归功于新中国第一代领导人的高瞻远瞩。新中国成立初期,满目疮痍,一穷二白,但开国领袖们非常有眼光,重视计算机技术研发。
1952年,国家就成立电子计算机科研小组,由数学研究所所长华罗庚负责。计算机小组提出了一台串行的电子管计算机的轮廓设想,性能参数与EDVAC计算机和EDSAC计算机相当。
【注:EDVAC计算机为离散变量自动电子计算机,是美国早期的电子计算机。EDSAC计算机为电子延迟存储自动计算机,是英国同时也是世界上第一台实际运行的存储程序式电子计算机。】
就在这个时期,夏培肃院士完成了第一个电子计算器和控制器的设计工作,并编写了中国第一本电子计算机原理讲义。在院校开设了计算机设计、程序设计和计算机方法专业训练班,并送技术尖子赴苏联进修。
1956年,国家制定了发展我国科学的12年远景规划,把开创我国的计算技术事业等项目列为四大紧急措施之一。中国科学院则成立了计算技术研究所筹备委员会,将人才集中到该研究所,并依靠从苏联获得的技术图纸和苏联在156项工程中援建的电子管工厂设计、生产自己的计算机。
1958年,原七机部高级工程师张梓昌对苏联提供的M-3机设计图纸进行局部修改后,成功研制出103计算机,运算速度达每秒3000次,该计算机共生产36台。
1959年,张效祥教授以苏联还在研制中的БЭСМ-II计算机为模板,成功研制104计算机。该机共生产7台,每秒运行1万次,在原子弹的研制过程中发挥了重要作用。
103计算机和104计算机的诞生,使中国计算机完成了从无到有的跨越。而且,因为是仿制苏联的先进计算机,在技术起点上比较高——仅次于美苏。
1960年,夏培肃院士带队设计的107计算机研制成功,并被安装在北京玉泉路中国科学技术大学。107计算机是一台小型的串联通用电子管数字计算机,是新中国第一台自主设计的计算机,标志着中国的计算机从模仿到自主设计的跨越。中科大以107计算机为基础,编写了《计算机原理》和《程序设计讲义》,作为该校计算机专业、力学系、自动化系、地球物理系的教材。107计算机除了为教学服务外,还服务于潮汐预报、弹道计算、核物理、力学、微波等领域。
也是从上世纪60年代起,中苏关系开始恶化,《中苏友好同盟互助条约》名存实亡,赫鲁晓夫撤走了在华的全部专家。与此同时,西方也对中国进行着严格的技术封锁。
在美苏的技术封锁下,中国只能走自主设计、自主生产的发展路线。1964年,哈军工成功研制出新中国第一台全晶体管计算机441B,相对于美国的第一台全晶体管计算机RCA501晚了6年。
441B在天津电子仪器厂共生产了100余台,主要用于军工、科研、气象、油田勘探等,该机最大特点就是高可靠性和高可维性。1966年,北京举办计算机展览,恰逢邢台大地震,441B计算机是唯一不受地震影响,稳定运行的计算机。
1964年,吴几康成功研制119计算机,该计算机运算能力为每秒5万次,运算能力略强于美国于1958年制造的IBM709计算机。1965年,109计算机研制成功,该机由2万多支晶体管、3万多支二极管组成,稳定运行15年。109和119计算机在我国研制氢弹的历程中立下汗马功劳,被誉为研制氢弹“功勋机”。
1965年,中国自主研制的第一块集成电路在上海诞生,进入集成电路时代只比美国晚了5年。1972年,自主研制的大规模集成电路在四川永川半导体研究所诞生,实现了从中小集成电路发展到大规模集成电路的跨越。而美国从中小规模集成电路发展到中大规模集成电路,用了8年时间(1960年到1968年)。
1972年尼克松访华后,中国和西方的关系有所缓解,中国通过特殊渠道购买了少量单机设备,并将其消化吸收,推陈出新,搭建了自己的生产线,中国计算机自此告别了单机型生产百余台的历史。
在完成对国外设备的仿制并大量生产后,国产计算机更是进入大批量生产时代——批量生产的计算机有161型“南华”牌台式计算机、LX-121型银行利息机、130系列、150系列、180系列计算机。其中,130系列计算机产量最大,总产量近千台。1979年研制的HDS-9计算机每秒运算500万次,是美国1972年IBM370-168计算机运算能力的两倍。
彼时,我国计算机技术虽然与西方有5至8年的差距,但在局部领域却追平西方,比如上海无线电十四厂于1975年成功开发出的1024位移位存储器,就基本达到国外同期水平;中科院上海冶金所还独立发展了制造集成电路所需要的离子注入机,并出口到日本……
到上世纪70年代末,中国科研人员和产业工人发扬自力更生、自强不息的精神,建成了中国自己的半导体和计算机工业,掌握了从单晶制备、设备制造到集成电路制造的全过程技术。
3
彻底拆除“玻璃房子”
上世纪80年代,在“造不如买、买不如租”“市场换技术”等政策指导下,半导体产业发展受到严重影响。芯片也从自主研发转变到购买国外芯片,比如1983年,浪潮开始采用进口Intel8088芯片,而非国产芯片组装0520微机,在80年代至90年代初研制的长城286、长城386、长城486、2780机、太极2220、银河超级小型机、HN2730超级小型机等计算机均采用国外芯片。中国第四代计算机中的巨型机代表机型——“银河1”巨型计算机耗资1亿元人民币,但因大量购买国外硬件,未能对中国的半导体产业进步起到太多积极作用。
到80年代末,中国凭自己的技术已经很难生产出一台计算机了。到90年代初,以联想为代表的中国计算机企业纷纷转向“贸工技”路线,只从事低附加值的微机组装,无力也无心从事芯片研发,国内芯片市场彻底落入外资掌控。
在中国丧失独立自主研发制造计算机的能力后,美国政府开始严格限制对中国出口高性能计算机。在当时,高性能计算的应用涉及的基本是堪称国家命脉的领域,如国防军工、油气勘探、水电利用等。由于中国当时还没有自主研发的高性能计算机,所需要的计算机只能依靠进口,价格昂贵,维修管理困难。中国进口计算机就花掉近20亿美元,维护费用动辄千万。
原石油工业部地球物理勘探局曾花费巨资从国外购买了一台大型机,没想到,对方对后期的集成和维护费用开价百亿以上。不仅如此,对方还提出了一个让中国IT人铭记了十几年的屈辱条件——在设备使用过程中,为防止机器核心技术外泄,设备机房采用全透明的玻璃墙壁,对方要时刻监控我国工作人员的一举一动,甚至连高性能计算机的启动密码和机房钥匙都要由对方控制。
为了彻底拆除“玻璃房子”,研发出完全拥有自主知识产权的国产高性能计算机,我国的科学家们走上了一条异常艰苦的突围之路。
1993年,中国高性能计算机曙光一号并行机终于研制成功。曙光一号的战略效应立竿见影:它诞生的第三天,美国便宣布解除10亿次计算机对中国的禁运。可以说,曙光一号成功打破了国外IT巨头对我国信息技术的垄断,推动信息产业再次走上了自主发展的道路。
1995年,在只有十余名研究员、500万元经费的情况下,曙光1000大规模并行计算机成功研发。曙光1000达到了20世纪90年代前期的国际先进水平,荣获了1996年中国科学院科技进步特等奖和1997年国家科学技术进步一等奖。
1998年,曙光2000问世,总体水平达到了90年代同期国际先进水平。2001年,曙光3000诞生。2004年,曙光公司研发出4000A,成为国内首台每秒运算超过10万亿次的超级计算机,并代表中国首次进入全球超级计算机TOP500排行榜,位列第十位。
2008年,曙光5000降生,其系统峰值运算速度达到每秒230万亿次浮点运算,让中国成为继美国之后第二个能制造和应用超百万亿次商用高性能计算机的国家。
2009年,第一台国产千万亿次超级计算机天河1号在湖南长沙亮相。2010年,国防科大对天河1号进行了升级,使其成为当时世界上最快的超级计算机。
2010年,曙光6000问世,以实测每秒达1271万亿次的峰值速度,在2010年的第35届全球超级计算机TOP500中名列第二。
2012年,神威蓝光超级计算机投入使用。该超算使用了8704片申威1600,搭载神威睿思操作系统,虽然超算绝对性能并不高,但却是中国在“市场换技术”之后,首次实现了超算CPU和操作系统的全部国产化。
2013年,国防科技大学成功研制出天河2号,高达55PFlops的性能使其傲视群雄,六度蝉联TOP500排行榜首位。不过,天河2号使用了美国英特尔公司的超算芯片,不久美国政府就禁止向中国超算中心出口英特尔的超算芯片。数年后,国防科大用自主研发的矩阵2000加速卡替换了美国超算芯片,并将性能从55PFlops提升到97.9PFlops。
2018年10月16日,国家超级计算无锡中心的“神威·太湖之光”超级计算机。图|新华社
2016年,神威·太湖之光问世,成为全球首个性能超过100PFlops的超算,四度蝉联TOP500排行榜首位。值得一提的是,神威·太湖之光延续了神威蓝光超算的高自主性,在超算芯片、操作系统、互联等关键技术上全部实现国产化。
2021年,中国新一代超算横空出世,三个应用入围“戈登贝尔奖”,一个应用获奖,足以证明强劲实力。
不过,看到成绩的同时,我们也要看到不足之处。
其一是我国高性能计算软件的缺失。目前,我国不少大型科学计算的软件仍需进口,超算经费用于应用软件开发的不到10%。
其二是企业级应用较少。汽车行业的通用、克莱斯勒等公司,每家都有10多个超算系统,英国石油公司(BP)则拥有世界上最大的工业用超级计算机,我国使用高性能计算机较多的是互联网公司,在制造业的应用规模较小。
其三是几大超算架构不统一。神威、天河、曙光三大系列超算各成体系,软件不能通用,移植工作量异常巨大,不利于超算通用化和商业化。
历经70年的发展,中国超算技术积累已经非常雄厚,在芯片、操作系统、互联等关键技术上均实现自主研发,但是留给我们的挑战依旧很多,路还很长。
「 支持!」
您的打赏将用于网站日常运行与维护。
帮助我们办好网站,宣传红色文化!