arrow
第十四卷, 第二十期
2017国际高性能计算论坛开启“超算+”时代

来源:中山大学数据科学与计算机学院


2017国际高性能计算论坛(IHPCF2017)进入精彩的第二天。今天围绕着“超算+”, 美、日、俄、法、中各国专家就高性能计算与大数据、AI的融合发展,云计算模式下高性能计算应用服务的设计与实现,以及E级融合计算的实现等问题展开了深入的探讨交流。此次论坛为世界超算开辟了更广阔的发展之路,在促进“E级计算”前进的同时开启“超算+”时代。

近年来,随着互联网新兴产业的快速发展,特别是云计算、大数据、人工智能(AI) 等前沿技术的快速崛起,普通计算已难以满足它们对海量数据存储、大规模计算、应用平台支撑的发展需求。与此同时,超级计算机的应用领域也正在进一步拓展,超算与这些前沿技术的融合成为了势不可挡的发展趋势。

继昨天2017国际高性能计算论坛盛大开幕式及精彩报告后,9月20日,围绕着“超算+”,与会专家就高性能与大数据、AI的融合发展,云计算模式下高性能计算应用服务的设计与实现,以及E级高性能计算在系统、架构、编程框架与应用等领域的创新等问题展开了深入的探讨与交流,又一次将2017年国际高性能计算论坛的技术交流、学术研讨的氛围推向了高潮。

超算+大数据+AI: 改变世界值得期待

当前,人工智能(AI)是科技界话题讨论的热点,引起了广泛的关注。但是,AI需要在高性能计算、成熟算法和大数据三大力量的支撑下才能展现出强劲的生命力。 
为了满足AI的超大规模计算需求,超级计算机已逐渐成为训练各种深度神经网络的利器。论坛上,各国专家就当前高性能计算与大数据、AI融合技术的发展展开了热烈的讨论。

日本东京工业大学的Satoshi Matsuoka教授详细介绍了目前Green500榜单上能效最高的系统TSUBAME3,该系统针对大数据和人工智能应用从通信带宽、内存层次、低精度算法等多个方面展开深度优化,这些优化技术将用于构建世界上最大的针对大数据/人工智能应用的公共开放基础计算设施(ABCI,AI-Based Bridging Infrastructure);中山大学徐峻教授讲解了计算机药物设计的基本概念与方法,介绍了基于高性能计算的新型子图产生算法DSGA以及针对分子叠加的加权高斯算法WEGA,最后展望了大数据分析在制药工业领域中的应用;普林斯顿大学William M. Tang教授介绍了深度学习技术在核聚变反应异常监测中的应用实践,他们提出了一种称作FRNN(FusioRecurrent Neural Net)的循环神经网络,并采用分布式数据并行、异步参数更新、MPI通信等技术实现高可扩展性,预计将扩展到数千GPU规模。

超算+云计算
超算云让计算更便捷云计算是在近几年随着互联网发展起来的新兴计算,其依靠着灵活的扩展能力主要应用于社交网络、企业IT建设和信息化等数据密集型、I/O密集型的领域。超算与云计算有很多相似的特点,如两者都使用了分布式计算、网格计算、集群、高通量计算等。那么,超算与云计算能否走向融合,开辟出更广阔的发展之路呢?论坛上,国际专家们就超算与云计算的融合创新发展之路进行了探讨。

美国伊利诺伊理工大学孙贤和教授针对高性能计算与大数据处理融合的趋势,提出了在文件系统层实现两类应用有机融合的新型计算框架PortHadoop-R。该框架吸收并行文件系统和MapReduce各自的优势从而实现高并发、低延迟数据访问,允许Hadoop节点直接访问并行文件系统中的数据,实现数据传输与基于R语言的数据分析和可视化的有机结合,使得PortHadoop-R在NASA的气候模拟应用上取得了15倍的加速比;美国威斯康辛-麦迪逊大学Miron Livny教授介绍了他们研发的一种对动态计算和数据密集型负载进行实时容量规划的高通量动态调度技术,其在数据挖掘、机器学习、图像处理、统计推理等应用领域具有很大优势;国家超级计算广州中心主任卢宇彤教授分析了天河二号的应用现状和用户需求,提出了HPC无处不在的愿景,计划进一步完善天河上现有的混合可定制软件栈——天河星光平台,进一步统一资源管理、统一数据管理以及统一应用管理。天河星光平台即可以帮助用户高效使用天河计算和存储资源,又可以帮助领域应用开发者方便地开发大规模异构并行程序。最后卢主任介绍了目前在天河星光平台上完成的诸多教育、科学、工程、智慧城市等应用成果。

E级计算: 系统架构需创新突破

继昨天关于E级系统架构创新突破的热烈讨论之后,与会专家们再次围绕E级计算时代的高性能计算新型体系结构设计、系统优化、编程框架、软件环境等影响E级计算发展的关键问题展开论述,并毫无保留的分享了各自的探索实践经验。

William Gropp教授指出,现有的网络互连性能评价模型和MPI通信机制在多核/众核条件下表现不足,针对当前的MPI编程模型作适当的扩充并结合软硬件实现协同优化将是有效的解决方案。William Gropp教授因此提出MPI+X的概念,将MPI与OpenMP、Pthreads、OpenCL、OpenACC、CUDA等多种编程模型有机结合,并适当考虑CPU、网卡、内存、操作系统的特性,辅以新的算法和软件实现,充分发掘系统的网络互连性能;北京应用物理与计算数学研究所的莫则尧研究员介绍了针对数值计算的高可扩展性框架的理论和方法,该方法基于Patch-Centric数据并行策略实现了高可扩展性。同时针对传统的Domain-Specific 并行编程方法,建立了涵盖结构网格(JASMIN)、非结构网格(JAUMIN)、组合几何(JCOGIN)三种框架。通过组件封装的方法,方便地实现了并行程序的生成。目前,该框架已经成功地应用在了近百种不同领域涵盖各种数值方法的计算程序的并行优化中,为用户带来了极大的便利;日本筑波大学的Taisuke Boku教授介绍了一种在含有FPGA的异构集群中灵活使用FPGA实现计算加速和互联加速的技术,该技术充分利用最新FPGA上100Gbps光互联接口和FPGA固有的高并发性,依托以太网构建低延迟大规模互联网络。基于该技术的原型系统AiS(Accelerator in Switch)已经部署在日本最快的超级计算机Oakforest-PACS上,并在多个应用上取得了成功。

论坛的最后进行了专题研讨,就E级计算的体系架构发展趋势、高性能计算和大数据融合发展的挑战,以及人工智能是否能成为高性能计算发展的助推器等问题进行了深入的探讨。

“E级计算”、“超算+”时代 : 未来很快就来

感谢国际超算专家带来的精彩报告,同时感谢各参会者的积极参与,持续两天的2017国际高性能计算论坛(IHPCF 2017)在热烈的掌声中圆满落幕。本次论坛为中、美、 日、德、俄等各国高性能计算研究者们提供了良好的国际交流合作平台,通过对高性能计算系统、网络架构、系统软件、应用支撑等关键技术的探讨研究推动了高性能计算向E级目标迈进;同时各国超算专家就超级计算与当下热门的大数据、人工智能、云计算等前沿技术的融合创新发展分享了各国经验和取得的成果,为世界超算开辟了更广阔的发展之路,在促进“E级计算”发展的同时开启“超算+”时代!

未来,国家超级计算广州中心将依托全新升级的“天河二号A”系统进行典型应用移植和优化,充分发挥它强大的计算能力和丰富的软件资源优势,以服务“大科学”、“大工程”和“新产业”为重心,致力于推动高性能计算与大数据、人工智能以及云计算融合发展,加速国产超算系统和应用水平走在“超算+”时代前列!