【最全】世界计算机发展史

  2017年发布的全球超级计算机500,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,中国超算上榜总数首次超过美国,名列第一(中国有167台HPC入围TOP500,美国是165台)。

  相对于天河2号采用Intel的至强PHI计算卡,本次刷榜的“神威太湖之光”从CPU到互联网络、存储列阵等关键组成部分全部实现了国产化。

  如果说天河2号因为使用了Intel的计算卡而被一些别有用心之徒诟病的话,本次完全自主研发的“神威太湖之光”毫无疑问实现了中国在高性能计算领域对美国的逆袭。

  建国伊始,因军事和科研上的需要,国家非常重视计算机技术研发。除了积极培养本土人才,并送尖子赴苏联进修外,还积极吸引海外留学归国人才--这当中有曾在苏联进修的张效祥教授,有在英国爱丁堡大学攻读博士后的夏培肃院士,有在哥本哈根任无线电厂发展工程师的吴几康院长,还有非常“土气”的张梓昌高级工程师......他们成为建国初期仿制苏联计算机、自主设计计算机的栋梁。

  1952年,国家就成立电子计算机科研小组,由数学研究所所长华罗庚负责。计算机小组提出了一台串行的电子管计算机的轮廓设想,性能参数与EDVAC、EDSAC计算机相当。

  就在这个时期,夏培肃院士完成了第一个电子计算器和控制器的设计工作,并编写了中国第一本电子计算机原理讲义。在院校开设了计算机设计、程序设计和计算机方法专业训练班,并送技术尖子赴苏联进修。

  1956年,国家制定了发展我国科学的12年远景规划,把开创我国的计算技术事业等项目列为四大紧急措施之一,中国科学院成立了计算技术研究所筹备委员会,将人才集中到该研究所,并依靠从苏联获得的技术图纸和苏联在156工程中援建的电子管工厂设计、生产自己的计算机。

  1958年,原七机部高级工程师张梓昌对苏联提供的M-3机设计图纸进行局部修改后,成功研制出103计算机,运算速度达每秒3000次,该计算机共生产36台。

  1959年,张效祥教授以苏联还在研制中的БЭСМ-II计算机为模板,成功研制104计算机,该机共生产7台,每秒运行1万次,在的研制过程中发挥了重要作用。

  103计算机和104计算机的诞生,使中国计算机完成了从无到有的跨越。而且因为是仿制苏联的先进计算机,在技术起点上比较高--103计算机和104计算机在技术水平上仅次于美苏。

  1960年,夏培肃院士带队设计的107计算机研制成功,并被安装在北京玉泉路中国科学技术大学。

  107计算机是一台小型的串联通用电子管数字计算机,是新中国第一台自主设计的计算机,标志着中国的计算机从模仿到自主设计的跨越!

  中科大以107计算机为基础,编写了《计算机原理》和《程序设计讲义》,作为该校计算机专业、力学系、自动化系、地球物理系的教材。107计算机除了为教学服务外,还服务于潮汐预报、弹道计算、核物理、力学、微波等领域。

  因长波电台、联合舰队、中苏论战等事件的影响,中苏关系迅速恶化,《中苏友好同盟互助条约》名存实亡,赫鲁晓夫撤走了全部在华苏联专家,而在珍宝岛、铁列克提事件后,中苏几乎到了战争边缘,在60年代至80年代初,中国已很难得到苏联技术支援。

  与此同时,西方对中国进行严格的技术封锁。在美苏的技术封锁下,中国只能走自主设计、自主生产的发展路线,正如同志所说“封锁吧,封锁他十年八年,中国的问题就解决了”。

  晶体管制造对60年代初的中国而言难度不可谓不大,西方和苏联都认为中国根本不可能掌握该项技术。为解决晶体管制造难题,中国人民解放军军事工程学院四系四〇四教研室康鹏临危受命,成功研发“隔离-阻塞振荡器”(后被命名为康鹏电路),解决了晶体管的稳定性问题,使中国比美国晚近8年进入晶体管时代。“康鹏电路”问世后,中国开始量产晶体管。

  在解决晶体管制造难题后,哈军工(慈云桂主持设计)于1964年成功研制出新中国第一台全晶体管计算机441B-I,相对于美国于第一台全晶体管计算机RCA501晚了6年。

  441B系列计算机是我国第一台具有分时操作系统和汇编语言、FORTRAN语言及标准程序库的计算机。

  在天津电子仪器厂共生产了100余台,主要用于军工、科研、气象、油田勘探等,该机最大特点就是高可靠性和高可维性--1966年,北京举办计算机展览,恰逢邢台大地震,441B计算机是唯一不受地震影响,稳定运行的计算机。该系列机型平均使用15年以上。

  1964年,吴几康成功研制119计算机,该计算机运算能力为每秒5万次,运算能力略强于美国于1958年制造的IBM 709计算机,后者的运算能力为每秒4.2万次。1965年,109计算机研制成功,该机由2万多支晶体管,3万多支二极管组成,稳定运行15年。109和119计算机在我国研制氢弹的历程中立下汗马功劳,被誉为研制氢弹“功勋机”。

  1965年,中国自主研制的第一块集成电路在上海诞生,中国只比美国晚了5年进入集成电路时代。1972年,自主研制的大规模集成电路在四川永川半导体研究所诞生,实现了从中小集成电路发展到大规模集成电路的跨越。

  从中小规模集成电路发展到中大规模集成电路,美国用了8年时间(1960年到1968年),而我们的前辈,在被美苏同时封锁扼杀之时,只用了7年就完成了跨越(从1965年到1972年),他们的奉献和牺牲值得后辈铭记!

  在72年尼克松访华之后,中国和西方原本剑拔弩张的关系有所缓解,中国通过特殊渠道少量购买单机设备,并将其消化吸收后,大量仿制,推陈出新,搭建了自己的生产线。

  此后,国产计算机更是进入大批量生产时代--批量生产的计算机有161型“南华”牌台式计算机、LX--121型银行利息机、130系列、150系列、180系列计算机。其中,130系列计算机产量最大,总产量近千台。

  这批计算机也告别过去仅限于军工科研使用,使用范围扩大到政府机关、银行的数据采集和数据处理,工业控制,信息和事物处理等方面。

  在这个时期,虽然西方技术突飞猛进,但中国在局部领域也追平西方,比如上海无线位移位存储器,就基本达到国外同期水平;1979年研制的HDS-9计算机每秒运算500万次,是美国1972年的IBM 370-168计算机运算能力的两倍;中科院上海冶金所还独立发展了制造集成电路所需要的离子注入机,并出口到日本......

  截至70年代末,中国科研人员和产业工人发扬自力更生、自强不息的精神,建成了中国自己的半导体工业,掌握了从单晶制备、设备制造、集成电路制造的全过程技术。

  在80年代奉行“造不如买、买不如租”、“市场换技术”等政策后,中国半导体产业技术研发进入低谷期,技术人才要么流失到国外,要么去大学教书,有的甚至被调去看守机房。

  在这段时间里,自主技术被贬低,而洋技术被美化--很多非常有前途的科研项目被否决;不少科研项目更是在“外国专家”的“悉心指导”下被引上了歧路;甚至出现了中国企业使用自己研发的技术依旧要给外商缴纳专利费的现象。

  而自主研发CPU也被进口CPU取代,比如1983年,浪潮开始采用进口Intel8088芯片,而非国产芯片组装0520微机,在80年代至90年代初研制的长城286、长城386、长城486、2780机、太极2220、银河超级小型机、

  中国第四代计算机中的巨型机代表机型--“银河1”巨型计算机耗资1亿元人民币,但因大量购买国外硬件,未能对中国的半导体产业进步起到多大积极作用。

  在“造不如买、买不如租”理论的指导下,至80年代末,中国凭自己的技术已经很难生产出一台计算机了。到90年代初,以联想为代表的中国计算机企业纷纷转向“贸工技”路线,只从事低附加值的微机组装,无力也无心从事芯片研发,国内芯片市场彻底落入外资掌控。

  在中国丧失独立自主研发制造计算机的能力后,美国政府严格限制对中国出口高性能计算机。当时,高性能计算机的应用涉及的基本是堪称国家“命脉”的领域,如国防军工、油气勘探、水电利用等。

  由于中国当时还没有自主研发的高性能计算机,所需要的计算机只能依靠进口,价格昂贵,维修管理困难。在1994年,中国进口计算机就花掉近20亿美元,维护费用动辄千万。

  有专家表示,原石油工业部物探局曾花费巨资购买了一台国外的大型机,在后期集成与维护的费用上对方公司竟开出百亿以上的天价。

  不仅如此,对方还提出了一个让中国IT人铭记了十几年的屈辱条件--在设备使用过程中,为防止机器核心技术外泄,设备机房采用全透明的玻璃墙壁,中国使用人员的一举一动都在外国人的时刻监控下,甚至连高性能计算机的启动密码和机房钥匙都要由外国人控制!

  于是在中国的土地上,有了“中国人不得入内”的玻璃房子--在将列强赶走几十年后,中国的土地“中国人不得入内”又以这种形式重新上演了。

  为了彻底拆除“玻璃房子”,研发出完全拥有自主知识产权的国产高性能计算机,以曙光公司为代表的中国民族IT产业走上了一条异常艰苦的自主突围之路。

  90年代初,为了彻底打破国外对高性能计算机的垄断,国家派出一支年轻精干的科研小分队,远赴美国硅谷去进行曙光一号的研究。当时的科学计算所所长李国杰在黑板上写下了“人生能有几回搏”七个大字,斩钉截铁的对几个年轻人说:“派你们去,就相信你们一定能把机器给造出来!” 在每天工作十五、六个小时,长达11个月的封闭式研究后,科研小分队成功设计出曙光一号核心部分。

  在曙光一号的研发过程中,一些国外公司和国内买办对曙光一号研究小组的领头人李国杰院士说,“把钱给我,我给你造出来不就完了”。但李国杰院士坚持认为,高性能计算的核心技术必须掌握在中国人手中,这是一丝一毫都不能让步的,不仅要做整机研制,包括存储器在内的配件都要自己做。

  1993年,中国一台高性能计算机曙光一号并行机终于研制成功。曙光一号的战略效应可以说是立竿见影:就在这台高性能计算机诞生的第三天,美国便宣布解除10亿次计算机对中国的禁运!成功打破了国外IT巨头对我国信息技术的垄断,推动信息产业走上了自主发展的道路。

  1995年,在只有十余名研究员及500万元经费的情况下,中国成功研发出曙光1000大规模并行计算机。

  曙光1000在整体技术上居中国之首,并达到了20世纪90年代前期的国际先进水平,其运行速度的峰值达到了每秒25亿次,在当时我国大规模科学工程计算中发挥了重大作用。曙光1000也荣获了1996年中国科学院科技进步特等奖和1997年国家科学技术进步一等奖。

  1998年,曙光2000问世,总体水平达到了90年代同期国际先进水平,有些方面如机群操作系统、集成化并行编程环境和服务器聚集软件等已处于国际领先水平。

  2001年,曙光3000诞生,标志着我国超算产品正在走向成熟,能兼顾大规模科学计算、事物处理和网络信息服务,已然是国民经济信息化建设的重大装备。

  2004年,曙光公司研发出4000A,成为国内首台每秒运算超过10万亿次的超级计算机,并代表中国首次进入全球超级计算机TOP 500排行榜,位列第十位。

  2008年,曙光5000降生,曙光5000的系统峰值运算速度达到每秒230万亿次浮点运算,使中国成为继美国之后第二个能制造和应用超百万亿次商用高性能计算机的国家,也表明我国生产、应用、维护高性能计算机的能力达到世界先进水平。

  2009年,作为第一台国产千万亿次超级计算机的天河一号在湖南长沙亮相。天河一号超级计算机性能为每秒1206万亿次的峰值速度,Linpack实测性能为每秒563.1万亿次,强劲的性能使天河一号位列中国超级计算机前100强之首,也使中国成为继美国之后世界上第二个能够自主研制千万亿次超级计算机的国家。2010年,国防科大对天河1号进行了升级,天河1A的实测运算能力从天河1号的每秒563.1万亿次,提升至2507万亿次,成为当时世界上最快的超级计算机。

  2010年,曙光6000问世,曙光6000以实测每秒达1271万亿次的Linpack峰值速度,在2010年第35届全球超级计算机500强排名中名列第二。

  2012年,神威蓝光超级计算机投入使用。该超算使用了8704片申威1600,搭载神威睿思操作系统,虽然超算绝对性能并不高,但却是中国在“市场换技术”之后,首次实现了超算CPU和操作系统的全部国产化。神威蓝光超算峰值计算性能为每秒一千万亿次,持续性能为每秒796万亿次,性能功耗比超过741MFlops/W(百万次浮点运算/秒•瓦),LINPACK效率为74%。

  2013年,国防科大成功研制出天河2号,其高达55PFlops的性能使其傲视群雄,六度蝉联TOP500排行榜首位。虽然在计算节点上使用的是美国Intel的CPU,但天河2号也使用了4096片飞腾1500,用于高速互联网络系统。

  一直以来,别有用心之徒以天河2号使用美国CPU为由认为其不具备技术含量,其实超算系统可以分为软件系统和硬件系统两部分。

  超级计算机硬件系统主要由高速运算系统、高速互连通信网络系统、存储系统(I/O 管理结点和 I/O 存储结点)、维护监控系统、电源系统、冷却系统和结构组装设计等部分组成。

  CPU仅仅是其中的一部分,并不是超算硬件系统的全部,某些人以天河2号使用美国CPU为由认为其不具备技术含量的说法是荒谬而可笑的。事实上,同样使用E5和至强PHI计算卡的美国超算Stampede,不仅运算能力仅为天河2号的五分之一左右,整机效率也比天河2号更低,只有60.7%。

  如果说天河2号、曙光6000、天河1号等超算使用了国外CPU是白璧微瑕,那么,本次发布的新超算“神威太湖之光”则实现了CPU、操作系统、高速互联网络等核心软硬件的全面国产化--其CPU申威26010由260个核心构成,双精浮点峰值高达3TFlops,完全追平了Intel最好的超算芯片。

  得益于申威26010强劲的性能和良好的体系结构设计,新超算“神威太湖之光”的双精浮点峰值高达100PFlops。相较于美国于今年完成升级的Stampede 2,新超算在绝对性能上是Stampede 2的近6倍。

  这不仅彻底扭转中国在超算领域技术和信息安全上受制于人的局面,还在技术上实现了对西方国家的逆袭。

  自“天河二号”荣登TOP500榜首并6度蝉联桂冠以来,一直有社会舆论攻击“天河二号”使用美国Intel的CPU,因而不具备技术含量,甚至有媒体引用所谓业内人士声称“只要把足够多的手机芯片连接起来,性能轻松超越天河二号”,一言蔽之,就是“天河二号”是组装货,中国并不掌握超算核心技术。

  这种论调正确与否暂且不论,本次“神威太湖之光”采用了全自主技术则是对上述舆论的有力回击,不仅实现了在超算领域彻底扭转在技术和信息安全上受制于人的局面,还使美国对中国四家超算中心禁售Intel至强PHI计算卡成为笑柄,再次在信息技术领域实现了“凡是买不到的,中国人自己都能做出来”。

  超级计算机硬件系统主要由高速运算系统、高速互连通信网络系统、存储系统、维护监控系统、电源系统、冷却系统和结构组装设计等部分组成。具体来说:

  高速运算系统负责逻辑复杂的调度和串行任务和并行度高的任务,可以是采用同构计算(纯CPU组成计算节点),也可以采用异构计算(CPU+加速器组成计算节点);

  高速互连通信网络由infiniband、高速以太网、自定制互联机制构成,将所有计算节点连接起来,使其成为一个整体;

  维护监控系统保障超算不死机、不出错,毕竟每隔几秒出一次错,死一次机,这种足以让超算的使用者精神崩溃;

  结构组装设计是将上述系统装载到一起,在保障性能和稳定性的基础上,实现机柜体积最小。

  超级计算机软件系统主要包括操作系统、编译系统、并行程序开发环境、科学计算可视化系统等四个重要组成部分。具体来说:

  操作系统系统主要包括对同构技术或异构协同支持,高效能支撑扩张,基础服务内核,全局并行文件系统;

  编译系统的功能是支持C、C++、Fortran77/90/95等编程语言,支持OpenCL、OpenMP、MPI等并行编程语言,支持编译优化;

  科学计算可视化系统由海量数据服务模块、并行绘制与显示模块和可视化映射与操作模块组成。

  因此,运算系统、存储系统、互联系统、操作系统、基础库、应用软件,以及监系统控、冷却系统、电源系统等都是超算的重要组成部分。因此,一些人称因国产超算使用美国Intel的CPU,因而不具备技术含量,将CPU等同于超算的全部技术的说法显然是非常不科学的。

  有媒体引用所谓业内人士声称,“把足够多的手机芯片连起来就能超越天河2号。”但实际上,这个说法也是值得商榷的。

  因为堆CPU也是一个技术活,体系结构设计的不好,高速互联网络做的不行,系统软件做的不好,储存列阵做的不行,即使堆再多的CPU,超算的性能也上不去。简单粗暴的堆砌CPU根本不可能制造出一台超级计算机,更不要说是能与天河2号相匹敌的超算。

  另外,哪怕掌握了正确的堆砌CPU的方法,也不是单凭靠堆CPU数量就能获得一台能与天河2号相匹敌的超算。原因何在? 因为超算建设不是简单的搭积木式的堆砌CPU--即便堆砌了海量的计算卡,但受制于其他方面,比如高速互联网的技术水平,也会导致无法到达理论计算性能。

  具体来说,高速互联网络的难点在于超算的计算节点之间传输的数据量巨大,延迟要求严格,当互联网络效率不足,就会导致数据拥堵,大幅降低超算整机系统效率。而超算的计算节点越多,对互联网络的要求也就越高。因此,即使想通过堆砌CPU来提升运算能力,也会受限制互联网络的性能,造成这种做法并不能无节制的提升超算的性能--受制于诸如互联网络以及其他方面的瓶颈,整机效率被拉低,导致实际性能并没有因为堆砌了更多的CPU而有所提高。

  另外,堆砌过多的CPU还存在功耗过大、机箱体积过大等问题,非常不利于日后的运营维护和使用,在超算市场基本不具备市场竞争力。正是因为高速互联网络的重要性,相对于在2015年才对中国四家超算中心禁售Intel计算卡,高速互联网络却早就被美国列入技术封锁的名单。

  在软件系统方面,控制少量计算节点和控制大量计算节点对软件系统的要求近乎于天差地别。软件系统必须保证每个超算计算节点的性能被发挥到最大才能充分挖掘出硬件上的潜力,否则,就会影响超算的整机效率。

  另外,TOP500头几名的计算节点大多在数千近万,甚至一万个以上,某几个计算节点损坏,并需要更新是常有的事。当计算节点损坏时,软件系统必须做到部分节点损坏时不会发生死机、报错等情况,不影响计算任务的持续。

  因此,如果没有一个好的体系结构,那么CPU的性能将无法全部发挥出来,而且堆砌的CPU数量越多,整个系统就越复杂,对高速互联网络、存储列阵、监控系统、冷却系统和软件方面的要求也就越高,整机效率的提升也就越难。而体系结构设计能力水平不够高的情况下,单纯堆砌CPU数量,反而会降低整机效率,无法提升整机性能。

  “神威太湖之光”刷新TOP500排行榜,依靠的是其强悍的双精浮点性能--其高达125PFlops双精浮点峰值和93PFlops稳定性能让世人惊叹。其实,除了拥有举世无双的双精浮点性能之外,“神威太湖之光”还拥有整机效率高,整机功耗低、性能功耗比高,整机体积小等一系列优点。

  “神威太湖之光”超算拥有40960个计算节点,使用了上海高性能集成电路设计中心设计的国产众核芯片申威26010,采用28nm制程工艺,主频1.45G,拥有260个核心,双精浮点峰值高达3.06TFlops,在双精浮点上完全追平了Intel最好的超算芯片。正是得益于国产众核芯片申威26010的强悍性能,加上良好的体系结构设计以及互联网络等核心部件,使超算拥有异乎寻常的高性能、高效率、低功耗、高性能功耗比和小体积:

  高性能--神威太湖之光双精浮点峰值高达125PFlops,稳定性能为93PFlops,相比较之下,美国超算泰坦的双精浮点峰值高达27 Pflops,稳定性能为17.6 PFlops,天河2号的双精浮点峰值高达54.9Pflops,稳定性能为30.65PFlops,由此可见,“神威太湖之光”在稳定性能是美国超算泰坦的5.2倍(泰坦很可能是美国现在顶尖的超算之一,完成升级的Stampede 2性能为18PFlops)。

  高效率--“神威太湖之光”整机效率高达74.16%,相比较之下,美国超算泰坦的整机效率为65.19% ,而河2号的整机效率为55.83%,由于超算性能越强,规模越大,整机效率提升就越困难“神威太湖之光”在稳定性能是美国超算泰坦5.2倍的情况下,整机效率依然大幅优于泰坦,整机效率之高简直令人惊骇!

  低功耗--“神威太湖之光”的功耗为15.3 MW,美国超算泰坦功耗为9MW,天河2号为17.8 MW,可以说,“神威太湖之光”的稳定性能达到天河2号3倍的水平,但整机功耗却低于天河2号。

  性能功耗比高--“神威太湖之光”的性能功耗比高达6G/W,相比之下,TOP500超算榜单上的竞争对手都相形见绌--天河2号的整机性能功耗比为1.95G/W,美国泰坦超算的性能功耗比为2.143G/W,美国超算红杉整机性能功耗比为2.069G/W,日本超算“京”整机性能功耗比为0.830/W,美国超算Mira 整机性能功耗比为2.069G/W(Mira和红杉用的都是IBM的Power)……即便是全球Green500排行榜,“神威太湖之光”也能排至第三位。由于Green500排行榜第一和第二的超算只采用了低功耗版的Intel E5,性能非常弱,而即便是采用英伟达K80加速卡的超算,其整机性能功耗比也只有4.7G/W。因此,“神威太湖之光”在性能功耗比上显得格外耀眼。

  小体积--“神威太湖之光”机柜占地605平方米,美国超算泰坦机柜占地面积404平方米,天河2号机柜占地面积720平方米。

  中国有三大超算系列:天河、神威、曙光。三大系列超算分别由国防科大、曙光公司,以及地处江南的某研究所研制,当然,其中也不乏互相协作以及其他单位参与的情况。近年来,中国超算频频刷榜,不仅赚足了眼球,还为中国国防军工以及社会经济发展产生了促进作用。

  虽然“神威太湖之光”在整机性能、整机功耗、整机效率、性能功耗比等重要参数上无与伦比,但也并非尽善尽美,它也有自己的阿克琉斯之踵--其内存只有1.31 PB(天河2号为1.4PB)。另外,由于国产众核芯片内存带宽仅有136.51G,而且用的还是DDR3,相比之下,Intel的KNL和英伟达的Tesla都采用3D堆叠内存,内存带宽更是达到512G(Intel PHI)和 720G(英伟达 Tesla)。因为单个CPU的内存带宽不大,所以对于现实生活中的应用,很难跑出接近峰值的性能。对于某些对内存带宽要求高的应用,实际使用中就不如Tesla和PHI了。

  不过,这并非申威26010和“神威太湖之光”的硬伤,得益于申威26010异乎寻常的设计理念,使申威26010单芯片能够完成Intel E5+PHI,或Power+Tesla两款产品的功能,而且相对于Intel E5+PHI,或Power+Tesla,申威26010能够实现共享内存,这就避免了Intel E5+PHI,或Power+Tesla必须面对的显式拷贝,从而降低了对内存的压力,并减小了性能损失。笔者猜测,正是因为申威26010异常先进的设计理念,一定程度上弥补了内存上的不足,使中国科研人员敢于采用136.51G的内存方案。

您可能还会对下面的文章感兴趣: