高性能大带宽 AMD EPYC 助力圣母大学环境科学研究
2020年, 一场疫情让人们生活变了样,也让人类重新思考人与环境应当如何和谐共处。事实上,在过去30年间,由于人类行为和环境变化因素导致的新发传染病超过30种,而人类活动范围的扩大和生态系统的变化致使新的病原体更容易传播到世界各地。
环境科学研究正是帮助人类正确认识自然、改造自然的学科,世界上许多科研机构也正在致力于此项研究。作为其中的代表之一,圣母大学研究计算中心(CRC)利用包括AMD EPYC在内的领先科技来助力环境科学研究,在解决环境变化、生态系统建模等方面开展了积极的探索,也取得了显著的成效。
环境科研的背后:“无处安放”的性能和带宽需求
圣母大学研究计算中心 (CRC) 是全球众多致力于通过科研手段解决人类生存难题的高校科研机构之一。凭借高性能计算(HPC)设施提供超过 30,000 个核心的计算能力,CRC的学者们利用先进的计算、数据分析和其他数字研究工具的支持,帮助人类发现和解决社会与环境中不断出现的科学难题——包括癌症、环境变化、生态系统建模等。
俗话说,“好马须得配好鞍”。科研项目的水平和质量,不仅依赖于正确的科研方法,硬件基础设施的性能更有可能决定科研的“上限”。面对不断升级的科研挑战,CRC 进行的许多研究都需要高性能计算和高内存带宽的支持,才能在访问海量数据集的同时运行具有无限速度需求的特殊代码。如同很多依赖HPC的科研机构一样,CRC面临的挑战是日益增加的性能和带宽需求与研究中心有限的硬件条件之间的矛盾。
为了便于科研人员开展研究,CRC 决定增加一个新的HPC集群,以通过更大的企业级基础设施帮助教师探索更大型的研究。最终,他们找到了包括AMD和HPE在内的可信赖的合作伙伴 。
突破科研瓶颈:AMD EPYC 带来高性能大带宽
为了升级系统,CRC 采用了 AMD 和 HPE 打造的基于 AMD EPYC(霄龙)系列处理器的 HPE ProLiant DL385 Gen10 服务器解决方案。 AMD EPYC处理器系列具有高度的灵活性,特别是第二代AMD EPYC (霄龙) 7002 系列处理器,其核心数从 8 个到 64 个不等, 最多拥有128条线程,并支持PCIE 4.0和单路8通道DDR4 3200内存,配以单处理器插槽最高可支持 4TB 内存,从而通过出色的内存吞吐能力实现高性能计算。更重要的是,基于 AMD EPYC处理器的 HPE ProLiant DL385 Gen10 服务器为 CRC 提供了先进的内存容量、带宽和处理器核心,使其能够以经济、高效的方式运行内存密集型工作负载。
作为基于AMD EPYC处理器的HPC集群在北美洲高校的首批大规模部署之一,CRC 如期完成了部署并很快投入了运行。正如预期的那样,所有的代码很快就运行了起来。得益于该集群的实施,研究人员能够比以往更快地进行大型数据集分析,从而加速解决复杂的科研难题。
CRC 的副主任 Paul Brenner 教授表示:“AMD EPYC处理器为我们带来了前所未有的高性能。如果没有足够的内存带宽,科学研究就会遇到瓶颈。 AMD EPYC处理器在多核 CPU 芯片组和内存之间提供高带宽访问,有效地促进了更大、更高分辨率的模型的建立,而这类模型正是我们的教师感兴趣的。这是一项重大且全面的架构升级和改变。”
科研服务大众: HPC 集群释放科学无限可能
地球哺育了科技的诞生,科技也在用特别的方式反哺环境。如今,圣母大学的教授们正利用基于AMD EPYC处理器的集群,不断突破科学服务大众利益的边界。AMD EPYC处理器以其密集的计算核心和大带宽高速内存帮助CRC的科研人员们充分释放了科学的无限可能性。
圣母大学土木与环境工程和地球科学的助理教授Paola Crippa就是这些科研人员中的一位。他利用CRC的HPC集群来解析和模拟大气污染可能对人类健康产生负面影响,如导致心血管和呼吸系统疾病的风险等。该研究需要利用复杂大气模型的输出来量化微粒的社会影响,以及它们对区域和全球气候造成的影响。
“大气是一种非常复杂的系统,会随着多种动态变化和化学过程不断演变。要了解空气污染的基本机制,我们需要复杂的数值模型来解释所有这些过程,这需要付出很高的成本。得益于CRC里最先进的计算资源,我们能够以非常高的分辨率运行仿真。”Crippa 表示。
生物科学副教授 David Medvigy则利用CRC 的HPC集群研究森林砍伐与大气之间碳联系。该研究依赖于大量的数据计算,以显示森林砍伐面积的大小对气候造成的不同微妙影响。随着数据量的不断增加以及对自然实践过程更为复杂的理解,该研究需要编写更为复杂的代码。而要想运行这些代码,计算资源的速度至关重要。因为机器运行越快,可以完成的仿真就越多。
“我们在建模工作中使用了大量的实地观测信息,例如温度、入射辐射、降水和土壤条件。主要运行两种不同的数值模型——这两种模型都大约有 10 万行代码。CRC 的HPC集群为我们提供了不可或缺的计算资源。”Medvigy 表示。
毫无疑问,所有这些科研结果都将对指导人类社会实践以及全球范围内政策的制定产生一定的积极作用。基于科研的力量,环境专业人士将能够正确认识自然与人类的互动关系,进而找到更科学的方法来面对自然,改造自然,为保护人类命运共同体的目标而努力。而作为全球高性能计算的领导者,AMD将通过不断创新的技术帮助全世界的科学家和工程师们开展改善人类生活或地球状况的重要研究,最终共同创造一个可持续发展的美好未来。