中国超算发展除了面临美国挑战外,还经常被这个问题困扰

近日,美国新一代超级计算机Summit问世,在被中国占据榜首五年之后,美国超算重回世界第一宝座。Summit的峰值计算能力可以达到每秒20亿亿次,比中国最快的超算“威·太湖之光”还要快115%。新闻爆出后,立刻在国内引起了广泛的关注,有关超算技术和超算产业发展等话题的讨论再次被点燃。

500

一、中美超算争霸的历史回顾

回顾中美超算交锋的历史,在2010年之前,美国公司曾经长期称霸世界超算竞技场,美国的“蓝色基因”超级计算机曾连续5年独霸世界第一的宝座。直到2010年下半年,中国的“天河一号”在中国超级计算升级中心升级完成,成为中国首台排名第一的超级计算机,这才打破了美国在超算领域的长期霸主地位。

但是,到了2011年,日本的K-computer超越了天河一号成为世界第一,而且成为人类历史上第一次突破每秒1亿亿次计算能力的超级计算机。2012年,美国的超级计算机Titan(泰坦)再次帮助美国夺回世界第一的宝座。

2013年,中国的天河二号以每秒3.4亿亿次的速度再次登顶超级计算机榜首。此后一直占据第一名的位置达3年之久,美国人苦于一直无法做出超越天河二号的超算,就开始动起了歪脑筋,在2016年,当时的奥巴马政府宣布禁止Intel公司向中国出口用于超级计算机的顶级芯片,希望以此遏制中国超级计算机的发展势头。这一招果然“立竿见影”,第二年,天河二号就被挤下了超算世界第一的宝座,取代它的是采用了中国自主研发芯片“申威26010”众核处理器的“神威-太湖之光”,计算能力相比天河二号提高了几乎200%,达到了9.3亿亿次每秒。

由于中国超算长期位居世界第一,国内一些对欧美发达国家存在某种过度崇拜心态的人对此难以接受,抛出了所谓的“超算无用论”,认为片面追求运算速度对一个国家科技能力的提升并无用处,不过是形象工程。但这一次,美国发布的Summit超算把“神威-太湖之光”的记录又提高了一倍多,达到了20亿亿次每秒,正说明超算研发始终是大国科技竞争的战略重点,也打破了国内某些关于“超算第一无用论”的传言。超级计算机是“国之重器”,在石油勘探、工程模拟、环境监测、核工业等方面应用广泛,是支撑一个国家基础科学研究的核心武器之一。

对于美国这次的胜利反超,中国方面完全无需感到任何的沮丧,这种顶级计算能力的竞争对中国、美国乃至全人类都是喜闻乐见的良性竞争,中美轮流登顶是一件好事。而且,中国在超算方面的研发也并未停步,目前基于新处理技术的世界首台100亿亿次的超级计算机天河三号也正在研制过程中,预计到今年年底,天河三号的技术验证即可开始运行,但估计还要再过2~3年才能达到100亿亿次的运算能级。但中国在这方面的研究是走在世界前列的,因此在未来两三年内重新夺回第一超算的王座是比较有把握的。

二、中国超级计算机的研发布局与产业应用

从长远来看,中美在超级计算领域的争霸可能会持续很长的时间,轮流登顶在未来数十年都可能会是一种常态,中国要在这场战略竞争中取得优势,必须从研发和产业应用两个方面同时着手。超级计算机的发展,一方面有赖于国家战略性投入支持,另一方面也有赖于市场需求应用的拉动。必须广泛培育超级计算机的各种应用场景,创造更多面向科技产业进步的实际需求,才能为超级计算机的研制提供不竭动力,形成国家战略研发与科技成果市场化落地的良性互动。

(一)中国超级计算机的核心研发机构布局

目前来看,我国超级计算机的研发机构主要有四个,其中三个在北京,一个在长沙,在长沙的是国防科技大学计算机研究所,主要从事计算机系统结构、高可信系统结构、工程工艺、操作系统、编译系统及应用软件的研究与开发。该研究所也是我国最早从事超级计算机研发的机构,早在1983年就推出了我国第一台每秒运行1亿次以上的巨型计算机“银河1号”,也让中国成为继美国和日本之后又一个能够独立设计和制造巨型计算机的国家。此后,两次问鼎世界超算冠军的天河一号、天河二号以及未来的天河三号也都是该研究所研制的。

500

北京的3个机构分别是国家并行计算机工程技术中心、中科院计算技术研究所、联想数据中心集团。其中,2016年登顶世界第一的“神威-太湖之光”即由国家并行计算机工程技术中心研制。中科院计算机技术研究所的超算品牌为曙光系列,联想数据中心集团的超算品牌为深腾系列。

(二)中国超级计算机的主要生产制造布局

中国超级计算机的生产制造济南、天津、北京三足鼎立,位于济南的浪潮集团是我国超算集群系统份额第一的厂商,为哈工大设计了异构分布式的高性能计算系统,用于航天科技的研究;为青岛海洋科学与技术国家实验室提供了我国海洋领域规模最大,性能最强的超算系统;协助清华大学建设地球系统模拟器;为南方科技大学建设了整体计算能力超过300万亿次的超算系统。天河二号计算机的主架、机架和机柜也均由浪潮集团制造。

位于天津的曙光计算机天津产业基地是亚洲最大的超级计算机生产基地,基地年产能可达50万台PC服务器和2000套HPC。

位于北京的联想数据中心集团则在企业的超算系统市场居于全国领先地位,在全球高性能计算机TOP500的榜单中,联想研制的高性能计算机的数量已连续四次位居中国第一、全球第二(全球第一为惠普),并以17%的增长率成为全球增速最快的HPC厂商,目前全球500强企业超算系统中,有92家采用了联想的HPC。

从研发超算的厂商来看,美国企业占据优势,不过中国企业也表现出色。美国惠普以123台上榜系统位居第一,中国联想以81台继续占据第二;中国浪潮从半年前的20台增至56台,从上一期的第六名跃居第三名;美国克雷以53台排第四名,中国中科曙光以51台排第五名,IBM和华为各以19台同列第六名。


(三)中国国家级超算中心布局

这些国家级中心主要是指中国重要的超算的实际部署地,截至2007年,中国共建成了6座超算中心,包括无锡中心(神威-太湖之光)、天津中心(天河一号)、济南中心、深圳中心、长沙中心、广州中心(天河二号),其中天津中心在超级计算机的产业化运营方面走在全国前列,依托国防科技大学和中科曙光,建设天河科技园,以泰达服务外包产业园为依托,规划建筑面积150万平方米,借重“天河”品牌优势,在国家超算中心已有客户资源基础上,着力打造创业创新平台以及科技成果转化基地。目前,包括腾讯、惠普、华胜天成、猎聘等在内的科技、金融等领域入住企业达到80家。无锡中心也正在加快推动超算技术的产业化步伐,以“神威·太湖之光”为“圆心”,探索建设“超算产业园”。此前,国家超算无锡中心建设“神威社区”,集聚应用者、研究者共同营造提升自主体系下的超算应用生态。而产业园的探索,将推动超算产业链的打造,推动超算与优势产业的结合,形成更强的超算“产业能量”。另外四大中心目前主要还是以对外提供超算服务和相关的科技研发为主。

(四)中国超算技术的主要产业应用

超算技术的应用领域十分广泛,除了军工领域外,还在基础科学研究、新材料研发、大气海洋环境模拟、生物医药筛选、工程仿真、石油勘探、人工智能、智慧城市、图像渲染等方面有非常重要的应用。

1. 基础科学研究。在基础科学研究领域,超级计算机可以提供基础科学研究领域中的各类数值模拟服务以及作业脚本,设置若干可能影响计算性能的参数,完成相关计算模拟任务。目前,广州中心重点发展地球物理、天文学方面的应用,包括行星与大气模拟、中微子对宇宙大尺度结构演化的影响模拟、百万核量级地震模拟。由北京师范大学天文系教授张同杰领衔的宇宙中微子数值模拟团队,在“天河二号”超级计算机系统上成功完成了3万亿粒子数的宇宙中微子和暗物质数值模拟,揭示了宇宙大爆炸1600万年之后至今约137亿年的漫长演化进程。有专家指出,这一研究成果为通过天文观测手段研究宇宙中微子及其质量打开了一扇新的大门,有望大大缩短人类探索宇宙起源与演化奥秘的时间进程,对基础科学、宇宙环境、地球生态、矿藏勘探等领域的科学研究将起到积极的推动作用。长沙中心则重点研究固体物理、基础化学,典型案例包括溶液中结晶与形貌控制研究、负微分电阻效应的原理计算。天津中心重点研究凝聚态物理、计算机化学,典型案例如1/4玻色子占据的团簇莫特绝缘体的量子电动力学研究。

500

2. 新材料研发。计算材料学是近年里飞速发展的一门新兴交叉学科。它综合了凝聚态物理、材料物理学、理论化学、材料力学和工程力学、计算机算法等多个相关学科。其目的是利用高性能计算机,模拟材料的各种物理化学性质,深入理解材料从微观到宏观多个尺度的各类现象与特征,并对于材料的结构和物性进行预测,从而达到设计新材料的目的。目前,天津中心利用天河一号提供了材料科学方向的计算机模拟服务,通过在新材料计算平台上部署丰富的科学计算软件,为用户提供从原子水平出发,从微观跨越介观和宏观尺度,模拟材料研究中的各类问题和现象,并帮助用户实现通过计算来设计新材料的目的。典型案例如调控表面原子结构制备优异电催化剂、水的量子效应。广州中心重点研究新能源设计利用、新材料研发制备,典型成果如风电全生命周期资产管理、纳米硬度测量。济南中心主要研究模拟分析材料的理论性能,典型成果如非过渡金属杂质材料改性、非过渡金属缺陷对绝缘体材料改性。

3. 大气海洋环境模拟。从海洋环流数值模拟到空气质量实时监测,到海洋灾害预报等,高性能计算正在以强大计算力助力人类实现对环境生态的深入洞察,实现海洋环境数值预报的精确性,为我国海洋资源开发以及海洋环境保护提供技术保障。目前,广州中心主要对地区性乃至全球的风资源、洋流资源、太阳能等资源进行预测评估,典型案例如珠江口-南海区域海洋数字化系统、中国海区域大气海洋耦合模式、城市空气污染溯源研究。济南中心重点关注海洋与气候变化应用、气象应用,典型案例如海气耦合模式、南中国海内孤立波预报系统。天津中心主要进行天气预报与雾霾预警,国家超级计算天津中心联合中国气象局气象科学研究院、国家气象局卫星数据中心、清华大学、南开大学等单位,共同开展空气质量实时预警预报(雾霾)研究工作,在中国气象局新一代天气模式GRAPES的框架下,在线耦合大气化学模块CUACE/Chem,构建自动化实时雾霾预警预报测试平台,支持高分辨率雾-霾数值预报系统的建立,为我国和区域尺度雾-霾数值预报系统提供支撑。目前已实现预报系统的自动化运行,目前可进行全国15km精度雾霾数值预报和若干地区3~9km精度雾霾数值预报,可实时对外提供未来72小时关于PM2.5、PM10、SO2、CO、NO2、O3、AQI等参数的预报。

4. 生物医药筛选。超级计算机在探究基因奥秘、蛋白质结构、生物信息以及药物设计等方面已经成为不可或缺的工具。例如通过超计算机对生物大分子进行深入研究,从原子水平上来掌握生物大分子的三维结构和生物功能之间的关系,并在此基础上进行药物设计,是国内外生物医药研究的重要方向之一。与此同时,利用超级计算机进行高通量虚拟药物筛选在药物研发中的作用显得日益重要,也已成为国际上药物研发不可或缺的重要组成部分。在基因组学研究中,高通量测序是最重要的数据来源。然而,高通量测序技术的飞速发展,使得基因组学研究的数据急剧增长,急需超级计算机进行处理和分析。目前,广州中心主要研究药物筛选、基因组测序、精准医疗,典型成果如高通量短序列比对、药物虚拟筛选软件、心脏亚细胞钙离子动力学模拟。无锡中心重在评估药物效用,研究生物大分子动力学,典型案例如恶性肿瘤酶与药物原子水平、禽流感病毒通道构想变化。济南中心重点发展分子动力学模拟,如外切纤维素酶催化结构。长沙中心重点发展基因工程、药物筛选。重点案例有两项,一是基于受体的药物虚拟筛选。使用分子对接技术,针对与埃博拉病毒蛋白VP35的对接,采用160万CPU和MIC核协同计算,一天完成4000万分子化合物的抗埃博拉病毒药物筛选,是国际上目前最快的已知化合物筛选,为应对爆发性恶性传染病的应急药物快速研发提供了强大的计算模拟保障。二是构建我国最大、世界领先的生物医药信息处理平台,为我国自主药物研发提供技术支撑。重点支持靶向HIV-1蛋白酶抗艾滋病药物设计与基于IgG-Protein A 复合物结构的棉衣药物研究工作,开展了高达1024个CPU规模的HIV-1蛋白酶和免疫球蛋白IgG的分子动力学模拟优化,实现了每天10万种以上化合物的高通量虚拟筛选。


5. 工程仿真。工程仿真是通过数字图像建立工程系统模型并利用所建数字图像模型对实际工程系统进行实验研究的过程。利用模型复现实际系统中发生的本质过程,并通过对系统模型的实验来研究存在的或设计中的系统,又称模拟。利用超算进行工程模拟,能够大幅缩短企业的产品研发周期,降低研发成本,提供生产效益。目前,天津中心主要依托国家超级计算天津中心开展工程仿真设计,典型案例有整车气动性结构优化、汽车电池动力系统仿真等。广州中心依托国家超算广州中心进行工程仿真计算,利用“天河二号”强大的计算能力,使工程师能在几分钟或几小时内仿真和测试数千种设计方案,并通过远程可视化平台实时查看设计效果和修改设计方案。并以云服务的方式提供CAE计算和HPC访问,支持产品设计的全工作流。此外,广州中信还部署了一系列主流的商业软件ANSYS(Fluent、CFX、Mechanical),LS-DYNA,Abaqus,HYPERWORKS,FEKO,覆盖了多个学科多个领域的资源需求。自运行以来,广州超算中心协助中国商飞、广船、广汽等一批企业单位完成了诸如机翼选型、船舶减阻、汽车碰撞、器件结构优化等仿真计算,大幅缩短企业的产品研发周期,降低研发成本,提供生产效益。深圳中心依托国家超算广州中心进行工程仿真计算,如中兴手机跌落模型。长沙中心依托国家超算长沙中心进行工程仿真设计,如汽车车身结构快速优化设计。

6. 人工智能。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能的发展需要依靠三大支柱:强大计算能力、庞大的数据集合、不断演进和优化的模型算法。超级计算机则是人工智能这三大支柱最为坚实、可靠的供给源泉。目前,无锡中心集中研发人工智能机器人,如无人驾驶机器人、智能电话机器人。广州中心重点发展人工智能医疗,如眼科中心人工智能机器人。长沙中心也聚焦于人工智能医疗,通过打造医疗信息平台、智能诊断系统等,结合大数据、高性能计算和人工智能三大关键技术,结合循证医学和经验医学两大模型,将人工智能技术应用于医疗行业,核心算法融合一系列人工智能算法,白天辅助医生看病,晚上把最新的病例和手册等数据传输回超算中心进行机器学习,在学习中诊断,在诊断中学习,显著提高临床疾病的诊断效率和精度。其开发的人工智能医生CDSS是一个结合了“大数据+超级计算+人工智能”技术的临床辅助诊断决策系统。目前整套系统部署在国家超级计算长沙中心的“天河”超级计算机上,并于2016-17年在上海华山医院的呼吸内科、西安西京医院的精神科、301医院、中山医科大学附属医院等已有测试应用,取得了很好的实际效果。

500

7. 智慧城市。智慧城市是以多应用、多行业、复杂系统组成的综合体,支撑这个综合体的安全运行需要考虑基于云计算的网络架构。超级计算机的计算能力和海量存储能力能够深度挖掘数据,盘活存量数据,推动大数据与智能信息的融合。目前,广州重点建设多种类型云计算平台,如依托天河二号搭建的互联网智能销售系统、广东省省级教育数据中心。深圳中心主要搭建云计算服务平台,为政务、教育提供支撑。深圳科技创新委与市育局签订了联合创建深圳教育云框架协议,目的是为深圳所有市民打造一个一站式终身教育平台。超算中心除了提供服务器、云存储等IAAS底层基础设施外,还提供鹏云公共PAAS及学习空间、OA、学籍管理等SAAS模块建设。2013年9月1日,已经进行了教育云首期应用--网络学习空间的发布。截止目前,已经在深圳47所小学、初中、高中进行试点启动。长沙中心致力于搭建智慧城市各类云平台,如长沙市政排水管网云平台。天津主要搭建行业云平台,如滨海新区地铁Z4线BIM云。

8. 图形渲染。图像渲染是用软件将3D模型生成图像的过程。3D模型是用严格定义的语言或者数据结构对于三维物体的描述,它包括几何、视点、纹理以及照明信息。超算中心的渲染服务主要是针对高画质、高画幅的渲染情形。目前,天津中心主要构建天河动漫与影视特渲染平台,解决复杂场景渲染,典型项目包括生物危机游戏渲染、春晚舞台渲染、建筑漫游动画。无锡中心携手蓝海创意云、浪潮集团打造国家超算文创支撑平台,搭建了基于“神威·太湖之光”的超大规模集群渲染公共服务平台,为国内外文创产业提供超大规模云渲染服务。其中蓝海创意云负责超大规模云渲染服务的运营工作。蓝海创意云渲染农场建立在蓝海彤翔自主研发Golden Farm集群渲染系统软件基础之上,融合了云计算、并行存储等前沿技术,支持3ds Max、Maya、Houdini等各种主流制作软件,以及V-Ray、Redshift、Iray、Octane等渲染器,由高水准渲染工程师提供7*24小时技术服务支持,为动漫影视、建筑表现、CG艺术等全领域提供专业的云渲染解决方案。深圳中心主要与计算机3D渲染软件结合,如V-Ray渲染插件、3ds Max 处理图像、Maya三维动画等。

(五)中国超算能力过剩了吗?

关于中国超级计算机的利用率是否过剩,一直以来是一个颇具争议的话题,认为超算“算能过剩”的主要依据是2015年天河二号所在的超算广州中心主任袁学峰的一段话,在一次采访中,他表示天河二号的利用率基本稳定在40%左右,还有60%在等着别人用。但到2017年广州超算中心的超算利用率已经达到了84.5%,用户总数持续增加,经过近4年的发展,已经部署了700多个应用软件和工具软件,用户总数突破2000家,成为全世界用户数量最多、利用率最高的超级计算系统之一。从这个发展历程来看,所谓超算产能不足其实是一个发展中的暂时性地问题,顶级超算研制作为一个国家的战略性基础工程,必须和机场、高铁等重大基础设施一样,坚持适度超前的发展原则。如果出现超算刚刚投入使用就满负荷运行的情况,反而说明超算的研制出现了严重的滞后。天河二号是在2014年6月底才正式面向普通用户开放申请,一年后使用率达到40%,3年后使用率达到85%,现在基本满负荷运转,是一个非常合理的发展路径,目前中国第一、世界第二的神威-太湖之光利用率也已经达到了65%,相比天河二号同期的利用率也有很大的提高。

表1 国内超级计算中心利用率

总的来看,国内的六大超级计算中心资源利用率平均在75%以上,其中,广州、天津、深圳超过了80%,相比之下,国外超算中心的利用率普遍在60%左右。天津超算中心的中国首台千万亿次超级计算机“天河一号”每天在线任务量已超1400个,处于饱和运行状态,这是欧美国家级超算中心都很难达到的一个业务规模。

国内超算中心在项目承接方面也处于国际顶尖水准,其承担的项目多为国家级、省级科研课题,能够充分发挥超级计算机的性能。以广州超算中心为例,已累计为国内外419家用户提供计算服务,支撑国家级课题超过100项,广东省及广州市课题超过30项,百万核以上应用9个,十万核以上应用20多个。目前,中国顶级超算的研制应该说不存在能力过剩的问题,相反,还潜在着资源短缺的问题,加大更高运算能力的超算研制力度是当然之举、必然之举。

三、“应用难”是当前中国超算发展存在的主要问题

当前,中国超算在研制方面居于世界领先地位。如前所述,虽然美国的Summit暂时取得了世界第一的位置,但在100亿亿超算研发方面中国实际上是居于领先地位的,再次反超的可能性很大。2017年全球超级计算机500强中,中国的超算数量达到202台,数量是世界第一位。中国超算发展面临的主要问题并不在于顶级超算研制领域,而在于中高端企业超算的系统规模和超算的企业应用方面。

国内企业级超算应用严重缺失,美国超算企业级规模发达程度远超中国,美国较大的汽车、石油企业有10个大型超算系统,除此之外还有一堆小的超算机器,在中国汽车产业,超算主要用来算部件,而美国算的是整车。如果拿中美同等规模的公司做对比,美国公司的超算系统规模是中国公司的10倍多。

目前,超算推动超算技术的市场化应用面临着四大难点:


​1. 问题程序化难——科研人员难以将专业知识转化成超级计算机能够识别的语言。将专业知识转换成计算机能够识别的语言,超出了很多科研人员的业务范围,他们只能通过自学计算机编程或借助于计算机专业同行的支持,完成手头的项目。然而计算机编程对于专业的科研并无多大帮助。比如,对生物领域的研究者来说,将基因测序和蛋白质折叠转化成计算机代码和应用指令难度就很大。

2. 数据快捷传输难——对于各个学科来说,需要超算分析和处理的应用模型都是很大的量级,这也意味着如果应用人员通过网络上传到超算中心的话,需要漫长的时间。类似大气物理、地质勘探等数据,都是以TB级的标准来衡量的,数据传输对于应用人员来说不仅仅需要耗费漫长的时间,而且从超级计算机获取数据也需要网络的下载支持。

3. 全程自动自行处理难——超算数据自行处理能力差。由于平台的特殊性和应用的针对性,仅凭用户个人很难对所有的程序进行有效的监管,在出现错误的时候也很难第一时间获得报警。毕竟老师们还有很多工作去做,一动不动的盯在屏幕前检测系统状态并不现实。

4. 数据应用难——超算数据应用水平低。超级计算机数据的应用是超算应用的终极目标,项目结束后需要提供对应的数据报告,对项目的结果进行分析,这是用户非常关心的事情。如果依靠人力,依然是非常漫长而繁琐的工作。

四、优化中国超级计算机产业应用的发展建议

(一)培养编程人才,普及超算编程知识,提升编程转化能力

超算应用相关的人才缺乏是目前超算产业发展的主要短板,应从服务提供和应用能力两个方面进行相关培训培养,提高超算市场应用能力。

1.要提高超算中心的市场服务能力

研发方便编程的软件,建立专业的超算编程团队,对用户提供技术支持,帮助用户将专业知识转换成计算机能够识别的语言。

2.开展超算编程培训。

超算中心以及有超算需求的科研机构可以开展超算课程培训,提升从事科研人员的编程转化能力。如中山大学、清华大学等联合超算中心创建的超算学习平台。并尝试将超算课程引入高校,开设讲座或选修课。在高校开设讲座或选修课,让学生对超算能够整体认识,了解超算在各行各业的作用。在大量使用超算的天气预报、物理、化学等专业课中少量穿插超算介绍,使用学生能在需要的时候迅速找到努力的方向。

(二)提高应用软件转化超级计算机计算性能的水平

1. 鼓励更多企业及科研机构开发程序优化工具。

超算要想良好运行,需要成熟的超算通用软件,要对原有的程序进行针对性的优化。中国缺乏在软件领域有代表性的企业或科研机构,软件缺乏,超算的能力就无法施展。美国英特尔公司在产学研三端都在推行其代码现代化工作,以便不同类型的用户都能获得超算软件和编程方面的技术支持。并专门针对英特尔MIC架构高性能计算系统推出了《MIC高性能计算编程指南》工具书。

2. 成立国家级超级计算并行应用软件行业中心。

成立国家应用软件行业工程中心,能够有效的发挥超级计算机的计算能力,提高程序并行水平,同时提升应用软件的开发。并行中心应以重大专项为牵引,集中多学科人才和资源,稳定研发方向和人才队伍。

3. 建立开放式软件程序社区。

建立包含企业以及科研机构的软件程序开发社区,搭建超级计算机开发人员与用户之间的桥梁,让计算机开发人员能够更好的理解项目,有助于更好的发挥计算机的性能,用户也能对软件运行能否需要优化提出建议。

(三)减少超级计算机数据的网络传输时间

1. 架设专线网络,提升网络传输速度。

专线网络,能够优化用户到超算间的网络路径,提升数据传输的速度。如北京并行科技有限公司在北京与广州之间架设并行专线网络,优化用户到超算间的网络链路,并支持电信、联通、教育网等网络运营商。用户可以随时自动匹配或手动选择链路,找到最适合自己的、延迟最低的选择。

2. 搭建远程可视化平台。

通过远程可视化操作,减少数据传输的时间,用户可以在物理桌面中运行的应用程序,都能在虚拟桌面中运行。远程可视化平台也实时获得结果的反馈,方便对计算模型进行调整。上海超级计算中利用NVIDI公司的 GRID 技术,将图形加速能力带到企业在物理桌面上运行的程序,以满足每个用户的特定需求。

(四)提高超级计算机数据自行处理数据水平

超算数据管理专业平台能够帮助用户进行海量数据自动化管理,用户可以实时查看作业运行情况、诊断应用性能问题和帐单汇总报告等多重功能。因此,想要高超级计算机数据自行处理数据水平,就需要鼓励企业开发超算数据管理专业平台。如并行科技Paramon是并行科技针对超算管理专业平台,可以提供桌面端和手机端的全方位支持。此外,曙光推出了一款名为EasyOP服务平台,EasyOP采用互联网+的模式,实现7×24小时对高性能计算机程序的运行监控。用户不仅可以随时了解作业的运营情况和故障,还可通过网页或微信等在线咨询服务与线上专家进行一对一的交流。EasyOP拥有五大关键技术——监控数据实时远程采集、海量数据存储与展示、故障的分析与定位技术、大量数据统计与分析、移动终端的集成与推送。

(五)提高超级计算机数据应用水平

1. 开发性能更好、存储能力更强数据库软件。

好的数据库软件能将数据以一定方式储存在一起,能为多个用户共享,具有尽可能小的冗余度,建立与应用程序彼此独立的数据集合,具有整体性、共享性的优点。由于目前超算处理的数据越来越庞大,存储容量也是数据库很重要的参考指标。

2. 建立超级计算机数据分级、分类处理框架。

目前应用超级计算机处理的项目的数据量都比较大,想要实现处理数据高效、可靠、 简洁的需求,必须建立数据处理框架,对数据分类、分级处理。如 Google 公司设计的 Map Reduce 框架由 Map 与 Reduce 组成,以实现“分而治之”。换言之,就是将获取的数据源分成几个部分,每个部分则对应不同的初始Key/Value(键值)对, 并将其交由不同的 Map 任务区进行处理。

(六)促进超级计算机在企业领域的应用

1. 提供高性能计算力的云服务平台。

对企业而言,获取高性能计算能力一般有两种形式。一是自建超算集群,二是租用超算中心的计算资源。前者存在超算集群建设周期慢、价格贵、初始投资高、机型不能及时更新等问题;而后者也面临着超算中心资源难寻、计算资源迭代周期长、大规模伸缩灵活性欠佳等一系列问题。因此,以云服务的形式提供高性能计算力是促进超级计算机在企业领域的应用,解决企业困境的关键。云服务平台还具有快速可获取、资源灵活配置、硬件高性能等优点。

2. 满足多样化高性能计算场景需求

具有竞争力的平台应该能满足多样化的高性能计算场景需求,在工业制造(CAD/CAE、碰撞、材料模拟等)、生物基因和人工智能等场景都拥有相应的平台和行业应用集成,让客户在使用高性能计算服务时专注产品研发和创新,无需关注底层集群和调度系统,提升产品研发效率和上市速度。

3. 打造开放的超算云生态

在高性能计算领域,超算企业并不能满足于做一个单独的解决方案,更应该用开放的理念来建设超算云生态,需要从应用层针对性地匹配解决方案,才能让场景更好落地让高性能计算力更好地服务于各行各业的密集型计算需求。

【作者简介:李晓鹏,国研智库产业经济研究院院长;谢剑波,国研智库产业经济研究院主任研究员】

【参考文献】

1. 白瑞雪. 中国超级计算机的超级任务[J]. 瞭望.2013.

2. 刘云飞. NUMECA CFD高性能集群解决方案[J]. 计算机辅助工程.2012

3. 邓斐. 与天河零距离 参观国家超级计算天津中心[J]. 微型计算机.2011.

4. 张国双. 国家超级计算天津中心举行联合实验室签署仪式[J]. 现代化工.2016

5. 刘艳. 生物医药信息咨询的项目管理[J]. 现代情报.2004

6. 杨黎燕. 淀粉微球在生物医药领域应用[J]. 粮食与油脂.2011

7. 宋飞. 超级计算中心供电系统探讨[J]. 计算机工程与科学.2013

8. 吕成军. 过程级工业软件平台设计与实现[J]. 冶金自动化.2016

9. 周奇智. 用于车辆开发研究的驾驶模拟系统的设计[J]. 都市家教:下半月.2013

10. 刘堂春. “天河二号”蝉联最快超级计算机[M].中学政史地:初中适用. 2014

11. 王世豪. 广州建设国际科技合作交流中心功能定位分析[J]. 广东科技.2012

12. 子思. 解铃还须系铃人[J]. 中国农资.2012.

13. 刘行. 成都市发布云计算产品及解决方案[J]. 通信与信息技术.2012.

全部专栏