超级计算机的用处是什么?
应用层:解决方案
图 7 超级计算机应用示意图
随着计算机科学的成熟,越来越多的科研创新和应用问题解决离不开海量数据、高速计算,超级计算机成为了诸多领域不可或缺的技术手段。
1 石油气勘探
石油勘探,尤其是石油地球物理勘探,一直是高性能计算技术的传统和主要应用领域。长期以来,油气地球物理勘探技术的发展与应用高度依赖于包括高性能计算技术在内的信息技术的发展,尤其是近年来“两宽一高”(宽方位、宽频带、高密度)勘探技术的普及,和逆时偏移、全波形反演等一系列处理解释手段的应用,使得石油勘探对超级计算机的需求进一步增加。
国家超级计算天津中心基于“天河一号”开展的石油勘探数据处理程序,实现了复杂地质条件下上千平方公里数据的逆时偏移处理,支持中石油、中石化等单位大规模高精度三维成像处理软件的开发。解决方案与服务内容包括:①大规模地震数据处理软件的测试服务;②石油地震勘探数据的偏移处理服务,在“天河一号”平台部署了GeoEast地震数据处理解释一体化系统和GeoEast-Lightning波动方程深度偏移模块,可为用户提供叠前时间偏移、单程波叠前深度偏移和逆时偏移等偏移处理的计算平台服务;③石油应用并行优化开发服务,涉及处理新方法新技术研究、应用软件高性能计算开发与优化、行业信息系统开发等方面的开发服务。
2 生物医药与智能医疗
超级计算机在探究基因奥秘、蛋白质结构、生物信息以及药物设计等方面已经成为不可或缺的工具,生物医药与智能医疗也就成为了活跃度较高的应用领域之一。依托高性能计算、云计算、大数据及人工智能等技术的高度发展,生物医药、智能医疗技术必将推动医疗事业的繁荣发展,使国民健康行业走向真正意义上的智能化。
生物医药(Biological Medicine)综合应用生命科学与工程科学的原理和方法,从工程学角度,在分子、细胞、组织、器官乃至整个人体系统,多层次认识人体的结构、功能和其他生命现象,研究用于防病、治病、人体功能辅助及卫生保健的人工材料、制品、装置和系统技术。生物医药产业具有创新成本高、投资风险大、研发周期长等特点。而依托高性能计算、云计算及大数据平台开展相关科学研究和项目合作,可以大大缩短研发周期、降低创新成本、整体提高行业和企业的竞争力。
智能医疗(Intelligent Medical)通过打造医疗信息平台、智能诊断系统等,结合大数据、高性能计算和人工智能三大关键技术,结合循证医学和经验医学两大模型,将人工智能技术应用于医疗行业,核心算法融合一系列人工智能算法,白日辅助医生看病,夜间把最新的病例和手册等数据传输回超级计算机中心,进行机器学习,学习与诊断相互结合,显著提高临床疾病的诊断效率和精度。
案例:大规模基因数据处理分析。“天河一号”支持华大基因开展大规模生物基因处理及数据存储:①开发了基于GPU的高效基因测序处理软件,并利用该软件进行了3000株水稻的基因组重测序分析,短序列比对程序相对于之前应用的CPU版本速度提高15倍,且输出格式不需要再次进行转换,降低了I/O消耗;②构建Hadoop平台,将原来华大拥有的100个节点规模的计算平台扩展至数千节点,大幅度缩短项目的计算时间;③构建华大基因北方基因库,基因数据规模已经超过1PB;④开发完成了基于天河系统的群体基因型高分辨率分析软件,使用“天河一号”的Gaea软件15个小时便能完成人类64X的WGS数据所有分析过程。
图 8 全基因组测序成果
美国能源部和美国国家癌症研究院的联合项目CANDLE(CANcer Distributed Learning Environment)旨在实现面向疾病精准医疗职能的E级深度学习和模拟。目前此项目正在评估顶级社区开发的深度学习系统(Argonne的Theta,Oak Ridge的Summit早期访问系统和LLNL的Sierra早期访问系统),并在此基础上解决癌症的三个问题:RAS途径问题——是了解在30%的癌症中存在的RAS/RAF途径中关键蛋白质相互作用的分子基础;药物反应问题——开发用于药物反应的预测模型,可用于优化临床前药物筛查并推动针对癌症患者的精确医学治疗;治疗策略问题——自动分析和提取数百万癌症患者记录中的信息,以确定一系列患者生活方式、环境因素、癌症类型和医疗保健系统的最佳癌症治疗策略[1]。
由ORNL(橡树岭国家实验室)计算生物学家Dan Jacobson领导的一个研究小组利用ORNL的Summit发现植物细胞壁的关键调节基因,这些基因可被操作以增强生物燃料和生物产品。该团队的研究结果发表于2018年5月的《Frontiers in Energy Research》(能源研究前沿)。
ORNL用时也与美国退伍军人事务部之间展开战略合作项目,该项目的目标是将临床和基因组数据与机器学习和Summit的先进架构相结合,以更好地了解导致心血管疾病、前列腺癌、自杀心理、阿尔茨海默病、药物成瘾等疾病的遗传因素[2]。
3 工程仿真与航天器研发
工程仿真CAE(Computer Aided Engineering),即计算机辅助工程技术,是计算机和工程分析相结合形成的新兴技术,利用计算机辅助求解力学性能的分析计算结果、进行结构性能优化设计,是一种近似数值分析方法。其核心思想是结构离散化,将实际结构离散为有限数目的规则单元组合体,通过对离散体进行分析求解,得出满足工程精度的近似结果,替代对实际结构的分析,可以解决很多实际工程需要解决,而理论分析和实验验证又无法解决的复杂问题。
案例:在航空发动机研制中,气动稳定性是最重要的技术标准之一,需使用工程仿真技术对气压机以及涡轮的效率、涡轮叶片冷却效果等进行分析模拟,通过编制包含稳态及动态过程在内的程序,输入初始参数后,计算得到发动机各截面的气动参数和性能参数,透过航空发动机复杂的设计,直接模拟和观察到其工作特性和结构特性,进行结构设计优化。为达到航空发动机研发的精度要求,需要进行500-3000万网格以上的精细计算。通过超级计算机,可避免航空发动机台架试验的难度和危险性,将设计效果验证深度、广度增加,产品设计周期缩短(单个部件的分析时间可从一周缩短为5小时),大幅降低设计及试验验证成本,快速提升航空发动机整体创新水平。
图 9某型航空发动机内部三维流动工程仿真效果图
基于“神威·太湖之光”的超级计算机,对“天宫一号”飞行器两舱简化外形(长度10余米、横截面直径接近3.5米)陨落飞行(H=65km、62km、Ma=13)绕流状态进行大规模并行模拟,使用16,384个处理器在20天内便完成常规需要12个月的计算任务,计算结果与风洞试验结果吻合较好,为“天宫一号”飞行试验提供重要数据支持。
图 10 大规模并行模拟“天宫一号”两舱绕流状态
4 天气预报与雾霾预警
数值天气预报(Numerical Weather Prediction)是用数学方法构建方程,将气象数据和边界参数导入方程求解,从而预测大气变化和状态的科学。业务流程大致为:气象数据收集和预处理、数值天气预报流程、综合数值天气预报、天气学与统计学等输出预报结果。它是典型的计算密集型应用(Computing-Intensive),要求建立一个较好的反映预报时段的(短期的、中期的)数值预报模式和误差较小、计算稳定并相对运算较快的计算方法;其次,由于数值天气预报要利用各种手段(常规观测、雷达观测、船舶观测、卫星观测等)获取气象资料,因此必须恰当地对气象资料做调整、处理和客观分析;再者,由于数值天气预报的计算数据量非常之大,很难用手工或小型计算机去完成,因此,开展数值天气预报必须依赖超级计算机极强的计算能力。
案例:国家超级计算长沙中心为中部某省气象局提供了数值天气预报计算的平台支持,以提高天气预报、气候预测的及时性、准确性、可靠性和精细化,更早的对灾害性天气进行预警,更好地分析灾害天气情况的规律,更有效地形成防御灾害天气的对策。业务化运营后,该气象局数值预报能力大幅提升,WRF模式最高水平分辨率从20公里提升为4公里,覆盖包括该省在内的10*10区域;AREM暴雨模式水平分辨率从37公里提升为15公里;该气象局内部原有计算平台对中小尺度系统和强对流发展演变情况无法清晰模拟,但提高模式分辨率又难以满足时效性要求,超级计算平台解决了该省数值模式业务运算能力不足的问题,为省级数值模式预报业务发展创造了良好的运算环境,并进一步提高了天气预报预警服务质量和水平。
图 11 2015年4月2日08时~3日08时暴雨过程模式预报图
图 12 2015年4月2日08时-4月3日08时暴雨过程实况图
2016年,“神威·太湖之光”的“千万亿次八百五十万核可扩展非静力大气动力全隐求解器”,由中科院软件所、清华大学、北京师范大学等单位共同研发。项目发展了适应异构众核体架构的隐式求解算法与优化技术,使模拟的性能达到0.8亿亿次,与相同优化的显式求解算法相比计算速度提升近两个数量级,可支持500米大气动力模拟,是国际上领先的研究成果,将其嵌入到大气模式中,对我国解决高精度气象问题具有重要作用。
图 13 大气模拟中不同kernel的数据划分和任务调度
5 海洋环境工程
从海洋环流数值模拟到空气质量实时监测,再到海洋灾害预报等,高性能计算正在以强大计算力帮助人类实现对环境生态的深入洞察,实现海洋环境数值预报的精确性,为我国海洋资源开发以及海洋环境保护提供技术保障。
广州市香港科大霍英东研究院建立的CMOMS数值模拟系统,对中国近海环流、生态及碳循环动力系统的调控机理等前沿科学问题进行数值模拟,并在气候变化、全球变暖的背景下,对未来100年西太平洋-中国海区域的碳收支、循环及其变异等进行数值预测,为应对中国海域及其附近海域的气候变化提供参考与支持。
“神威·太湖之光”超级计算机实现了MASNUM海浪数值模拟的(1/60)°高分辨率的全球海洋模式,通过众核加速以及负载均衡、通信重叠和指令流水等优化手段,模式成功扩展到8,519,680核数,达到最高30.07 Pflops的峰值性能。该模式基于波数谱空间下能量平衡方程,以海浪谱直接模拟为目标。“神威·太湖之光”使其获得了优异的扩展性与并行效率。
图 14 利用“神威·太湖之光“模拟的全球(a)与区域(b)重要海浪高度分布
6 建筑信息模型
建筑信息模型(Building Information Modeling,简称BIM)是一项将建筑与信息相结合的综合技术,通过高性能计算机系统对建筑过程中产生的主要数据进行存储处理,可对建筑的规划、设计、施工、运营管理的全生命周期进行信息化管理,优化设计、控制成本、协助管理、提高工程效率与质量,为推动智慧城市的建设与发展起到重要作用。
图 15 远程可视化建模
案例:天津滨海新区天河建筑云产业园的建设就是以天河BIM云平台为基础的工程项目。天河BIM云平台以工程仿真系统、大数据平台和云平台为依托,为产业园建设提供四类服务:
①BIM远程可视化建模平台,用户本地无需采购高性能图形工作站、无需安装BIM建模软件,只需使用普通配置的主机连接到天河BIM云平台提供的桌面或应用程序,即可进行BIM远程可视化建模。
②BIM协同设计服务,以业主为核心,有效管控设计过程,减少设计风险,提高管控质量和效率,实现不同参与方、不同专业的多地点、实时协同工作。
③BIM仿真模拟,基于天河工程仿真设计平台,为建筑设计提供结构力学分析、流体力学分析和有限元分析等基础环境,如为建筑结构的强度及抗震分析,建筑单体与整体园区的室内外空气流通性等。
④BIM协同施工管理平台,支持多平台的BIM模型浏览。通过二维码实现BIM数据与现场信息高效而有序地交互和材料跟踪管理,记录状态信息并同步至BIM模型中。现场问题可即时在移动端以照片、文字记录至云平台,方便现场质量管理。计划任务、采集的完成时间与BIM结合,形成真实的可视化4D进度模拟,辅助进度管理。项目资料(图纸、文档、图片、视频等)分类管理,可与BIM构建关联,形成BIM资料库。
7 基础科学研究
随着计算机技术和应用的迅猛发展,利用高性能计算模拟已经成为基础科学研究中不可缺少的重要手段。
在过去几十年中,科研人员在化学、材料科学、生命科学、固体物理、生物物理、生物化学、药物研究等微观领域的研究中,基于量子力学方法发展了大量而可靠的非相对论薛定谔方程和相对论迪拉克方程的近似解法,用来模拟微观世界中原子和分子的相互作用和行为。
例如,①使用并行程序进行密度泛函理论(DFT)计算已经成为材料科学、固体物理、计算化学、计算生物学等领域内必不可少的研究手段之一;②并行实现的高精度耦合簇理论(CC)和组态相互作用(CI)方法被许多量子化学计算程序采用,成为计算化学的主要工具;③基于牛顿力学并结合了量子力学的分子动力学计算的并行实现,是生命科学、生物物理、生物化学、药物研究等领域的主要模拟手段。
江苏无锡的国家超级计算中心已利用新研发的“神威·太湖之光”超算进行算法库swDNN的深度学习。基于“神威·太湖之光”的异构众核处理器,已开发出针对卷积、矩阵乘等深度学习核心计算模块的算法库swDNN,通过采用计算任务划分、计算通信重叠、寄存器通信等优化技术,计算模块的计算效率可达到60%。相比于K40m图形处理器(graphics processing unit,GPU)上的cuDNN算法库,swDNN具有1.91-9.75倍的双精度浮点数性能优势。这一算法库可为人工智能开发开辟道路,目前国家无锡超算中心与中国电子学会、北京邮电大学合作,开展了以深度学习为核心的围棋人工智能项目。目前已完成软件开发优化,开始进入训练阶段,目标是利用“神威·太湖之光”这一超算平台,实现中国自己的专业级围棋人工智能[3]。
随着具备更强大计算能力的超级计算机的出现,人们可以模拟越来越大规模的微观系统、越来越长时间的微观过程、越来越精细的微观现象,从而极大地增强了对自然的认知能力。时至今日,高性能计算已在基础科学研究、工业工程、公益事业、国防安全等各个领域广泛应用,解决了一些重大、关键、具有挑战性的重要科学和工程问题,对支持科技创新、推动经济发展起到了重要作用。
如需获取人工智能最新前沿信息 ,关注微信公众号“学术头条”,
还可在菜单栏直接免费下载研究报告《超级计算机研究报告》PPT版和word版:
PPT版本报告:https://static.aminer.cn/misc/article/sc-p.pdf
word版本报告:https://static.aminer.cn/misc/article/sc.pdf
(自动驾驶 机器翻译 行为经济学 区块链 通信 机器人 自然语言处理 计算机图形学 )。
Copyright © 广州京杭网络科技有限公司 2005-2024 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有