陆遥
由中山大学牵头、北京大学、中科院软件所、中科院深圳先进技术研究院、浙江大学、南方科技大学、 广州大学和广东工业大学参加,成功申报了国家十三五重点专项“适应于E级计算的可计算物理建模与新型计算方法”。中山大学数据科学与计算机学院的许跃生教授为项目负责人。项目包含五个课题,许跃生兼一个课题负责人,其他四位课题负责人为中科院深圳先进研究院的蔡小川教授、北京大学的汤华中教授、南方科大的汤涛教授和广州大学的李志山教授。
我国高性能计算机的硬件研究目前已处于世界领先水平,以“天河二号”为代表的一批国产超级计算机运算速度在全球名列前茅。为了使我国高性能计算机的性能在“十三五”末期依然保持世界领先水平,我们需要在E级计算机的研制和面向应用的软件研发领域取得突破。高性能计算是解决科学技术问题的重要手段。在E级计算环境下,由于并行规模和通信量激增,沿用传统模型和算法很难充分发挥E级机的效能,亟需发展新的可计算物理模型和新型计算方法,以增加并发度、提高负载平衡、减少数据移动开销并提高算法的可扩展性及计算速度。
发挥高性能计算在重大科学技术研究和工程应用中的作用,核心问题应用问题的数学建模和高效算法。目前我国在该领域的研发落后于硬件的研究。这次成功申报的“适应于E级计算的可计算物理建模与新型计算方法”项目,旨在探索适合于E级计算机的数学建模和算法方法。该项目将根据E级机的特点,针对超高精度医学影像、核聚变中的磁流体稳定性、血栓形成机理和超高建筑抗震分析四个涉及到国计民生重要领域的应用问题,探索适应于E级计算的可计算建模及可扩展算法,为高性能计算的应用提供示范。
该项目将抽象出应用问题中的共性数学难点,针对这些具有共性的数学难点提出适合E级计算的新型可计算模型,发展求解这些模型的可扩展计算方法。为此,项目组将针对E级计算的关键难点研发适合于E级计算的具有自主知识产权的并行计算技术,实现模型、算法与机器体系结构间的匹配。同时从多个技术层面降低计算量和通信开销,提高算法的稳定性、收敛性、可扩展性、容错性及鲁棒性,实现百万核量级的并行计算,达到高效的并行效率。并对上述应用实例,在E级机关键技术验证原型和“天河二号”上完成数值模拟典型验证。
该项目将根据E级计算特点,提出四类应用问题的新模型:基于随机积分方程的 PET/CT 医学影像模型; 核聚变中磁流体不稳定性的超大规模高保真模型;基于从分子动力学到连续介质的血小板多尺度模型;超高层建筑的非线性力学精细模型。针对这四类新的物理模型,该项目将研究相关数学问题的高效计算方法,特别是大规模高精度数学模型的快速求解可扩展算法。并根据E级机体系结构特点,针对共性数学问题和基础算法,研究计算与通信负载均衡的优化方法与技术,提高算法可扩展性和性能。
该项目组由计算数学、计算机科学和应用领域的专家组成,包括一位中国工程院院士、两位长江学者和两位杰出青年基金获得者。该项目将充分发挥数学、计算机和应用领域科学家的专长和协同创新优势,从数学方法、算法优化、建模验证多层次解决可计算建模问题。通过抽象物理问题,提炼和归纳共性数学问题,从数学层面提出或改进能提高建模精度、计算规模与效率的模型。同时针对E级机体系结构特点,研究新型并行优化技术,发展高精度计算方法,提高深度并行计算效率,形成支撑四类应用建模的高效算法集,并对四类应用开展数值模拟和验证。
该项目研究成果将对生命医学研究起到重要的推动作用,并为临床诊断和病理探索提供科学依据。该项目所研究的PET/CT 成像的连续数学模型以及适合于E级计算的高精度医学影像重建算法,将在临床应用中实现低放射剂量医学影像成像。通过该项目研究,将在E级超级计算机上建立血小板相关的多尺度模型并设计适于E级计算机应用的高效数值算法,这将有助于理解血小板激化机制,指导溶解凝血药物的设计,这将对人类的生命健康起到至关重要的作用。通过高效并行算法的研究,该项目研究成果将有助于推动理论物理领域的数值模拟研究。等离子体的大尺度磁流体行为是当前聚变等离子体研究的重要前沿课题,该项目的研究将对提高托卡马克等离子体的约束水平有非常重要的意义。此外,该项目针对千米级超高层建筑在随机地震作用下失效模式识别的研究将有助于精确评价超高层建筑的抗震性能并理解其失效机理,具有重大的社会和经济意义。
该项目希望针对E级机体系结构特点,从建模、算法、高效实现多层面综合优化,提出具有创新性的具有自主知识产权的高效并行算法。同时面向具体应用问题,开展基于E级计算的高性能基础算法研究,建立了应用问题与E级计算机之间的桥梁。该项目的研究一方面将促进超级计算机的发展,扩展E级计算机的应用范围,另一方面将促进应用问题向高保真度、精细、快速方向发展,从而获得和理解一些过去难以获取的重要现象,提升我国科研水平和工业设计水平。