【HPC】业界主流HPC应用在X86平台实测性能对比
高性能计算(HPC)中最为重要的核心技术是并行计算(parallel computing)。并行计算是同时使用多种计算资源解决计算问题的过程,是提高计算机系统计算速度和处理能力的一种有效手段。它的基本思想是用多个处理器来协同求解同一问题,也可理解为将被求解的问题分解成若干个部分,各部分均由一个独立的处理器来并行计算。
本文作者的公众号有其他单独的文章介绍HPC主流的各个细分领域,本文主要关注的是X86平台处理器的在HPC工作负载的性能对比,故这里只对各个主流的HPC工作负载和特点做一些大概的介绍:
业界主流的HPC工作负载和特点
本文作者收集了目前业界一些主流的HPC应用在X86平台不同CPU型号的性能数据,根据引用来源测试的性能数据来看,Intel 至强铂金 9282 处理器在HPC主流行业的实测效果平均比AMD EPYC Rome 7742 高出31%。
Intel 至强铂金 9282 处理器是Intel目前在售的主打HPC和高端AI市场的旗舰产品,Intel为了帮助合作伙伴缩短产品上市时间,预先完成了设计,测试和验证服务器的工作,以整机的形式交付。
产品长这个样子:
AMD EPYC Rome 7742 是AMD 基于Zen 2 架构的旗舰型号,如图:
文中涉及的性能测试基于AMD 双路 EPYC 7742 (64 核心,2.25Ghz)与 Intel双路 Xeon-AP 9282(56核心,2.6Ghz),以AMD 双路 EPYC7742 的测试值为基准,具体性能数据如下(点击图片放大查看):
测试工作负载包含以下几类:
工业标准Benchmark:
Stream Triad, Stream benchmark是一个测试内存带宽的基准测试程序。
HPCG,HPGC 高度共轭梯度基准测试, 是现在主要测试超算性能测试程序之一, 也是TOP500的一项重要指标。
HPL,HPL 即 HighPerformance Linpack,它是针对现代并行计算集群的测试工具。用户不修改测试程序,通过调节问题规模大小N(矩阵大小)、进程数等测试参数,使用各种优化方法来执行该测试程序,以获取最佳的性能。
地球科学数值模拟
WRF,WRF(weather research forecast)是美国许多研究部门以及大学的科学家共同参与进行开发研究的第一代中尺度预报模式和同化系统,是目前应用最为广泛的中尺度天气预报模式。
制造与工业仿真
OpenFOAM 42M-cell_motorbike,面向对象的计算流体力学(CFD)类库。
ANSYS Fluent,计算流体力学软件。
LS-DYNA,显示结构有限元求解器商业软件。
生命与材料科学
VASP,VASP (Vienna Ab-initio Simulation Package),是电子结构计算和量子力学-分子动力学模拟软件包。目前材料模拟和计算物质科学研究中最流行的商用软件之一。
NAMD,NAMD是一个用于生物大分子大规模分子动力学的并行软件。
GROMACS,GROMACS是一个开源的高效的基于标准MPI并行环境设计的大规模分子动力学并行程序,基于GROMOS分子力场。GROMACS主要执行生物大分子如蛋白质、核酸、磷脂等物质的计算,也可研究非生物的有机大分子系统,如高分子多聚体等。
LAMMPS,LAMMPS是经典的通用性分子动力学程序,它可以在原子尺度、介观尺度和连续态尺度模拟液相、固态和气相状态的粒子系统,以及原子、高分子、生物、金属、半导体和颗粒系统,实现了固体材料、软物质、粗粒度或介观体系的力场。
本文作者查看了测试的详细配置,整理如下:
测试使用的Benchmark都是基于比较新的版本,比如在在GROMACS的测试结果是基于2019年6月份发布的2019.3版本和后续的2019.版本。
测试中Intel和AMD都应用了比较主流的优化包含启用AVX 256等。
Intel平台的测试环境使用了Intel的编译器(Intel® Compiler2019u4),Intel数学库(Intel® MathKernel Library (Intel® MKL) 2019u4),Intel MPI(Intel MPI 2019u4);BIOS配置中开启了超线程,关闭了睿频, 关闭了SNC,每个核心两个线程。
AMD平台的测试环境使用了Intel的编译器(Intel® Compiler2019u4),Intel数学库(Intel® MathKernel Library (Intel® MKL) 2019u4),Intel MPI(Intel MPI 2019u4);BIOS配置中开启了SMT,开启了Boost, NPS 4,每个核心两个线程。
由于是不同厂商的产品,平台之间存在配置差异。这些差异包含运行的每个内核的线程数目、Turbo 开/关、Intel SNC和AMDNPS等,不同厂商(Intel、AMD)均有针对最高性能的一些建议配置,以帮助各自的客户在各自的平台上达到最高性能。
以ANSYS Fluent 工作负载为例,针对HPC工业仿真细分应用的的测试结果参考如下(点击图片放大):
更多Intel ®服务器系统 S9200WK的产品信息: