IT之家12月19日消息,据美光发布,美光与AMD双方在奥斯汀建立联合服务器实验室,以减少服务器内存验证时间,在产品验证和发布期间共同进行工作负载测试。 目前美光适用于数据中心的DDR5内存和第四代AMDEPYCTM(霄龙)处理器均已出货,官方对其进行了一些常见的高性能计算(HPC)工作负载基准测试。 长期以来,超级计算机承担着高性能计算工作负载。此类大规模的数据密集型工作负载需要运行TB级的数据量以进行数百万个并行操作,以解决人类世界的难题,如天气和气候预测;地震建模;化学、物理和生物分析等。 随着计算机架构的进步,此类工作负载往往托管在超大型可横向扩展的高性能服务器集群中。这些服务器集群需要集合最强大的算力、架构、内存和存储基础设施,以满足关键工作负载对可扩展性、低延迟和高性能的需求。然而随着服务器CPU的性能和吞吐量不断增长,DDR4无法提供足够的内存带宽,来满足不断增长的高性能内核。 为缓解这一瓶颈,美光DDR5内存与采用了Zen4服务器架构的第四代AMDEPYC处理器联合,使服务器CPU能够更好地匹配内存产品,满足数据密集型工作负载对性能和效率的需求。IT之家获悉,美光对最新的AMDZen496核CPU和美光DDR5进行了行业内高性能计算工作负载基准测试,所有结果均显示性能提升了两倍。 STREAM1是常见的基准测试工具,用于测量高性能计算机的内存带宽,可捕获高性能计算系统的峰值内存带宽。 该工作负载使用的软件堆栈 Alma9Linuxkernel5。14 STREAM。f,2021年11月29日发布版本 测试设置 DDR4系统搭配第三代64核3。7GHzAMDEPYC处理器;DDR43200MHz系统2的RDIMM内存槽插满,共64GB DDR5系统搭配第四代96核3。7GHzAMDEPYC处理器;DDR54800MHz系统3的RDIMM内存槽插满,共64GB 测试结果 DDR5系统每插槽内存带宽翻倍,达到378GBs 该结果意味着客户能运行更大规模的人工智能机器学习(AIML)项目,或利用DDR5增加的内存带宽进行更多高性能计算。 此次测试使用的高性能计算工作负载代码针对天气和气候。WRF模型在一些支持高性能浮点处理、高内存带宽、低延迟网络等传统高性能计算架构中表现良好,测试对象为横向分辨率为2。5公里的美国大陆地区(CONUS)。 该工作负载使用的软件堆栈 Alma9Linuxkernel5。14 WRF2。3。54。3。3 OpenMPIv4。1。1 测试设置 DDR4系统搭配第三代64核3。7GHzAMDEPYC处理器;DDR43200MHz系统2的RDIMM内存槽插满,共64GB DDR5系统搭配第四代96核3。7GHzAMDEPYC处理器;DDR54800MHz系统3的RDIMM内存槽插满,共64GB 测试结果 美光DDR5搭配第四代AMDEPYC处理器,可实现1。3567时间步秒VSDDR4系统的2。8533时间步秒 速度更快意味着可使用更大的数据库或运行更多模型以进行天气预测,进而改善预测的准确度。 OpenFOAM是一种计算流体动力学(CFD)的开源高性能计算工作负载,广泛应用于多个行业,有助于缩短开发时间并降低成本。从消费类产品设计到航空航天设计,OpenFOAM能够模拟不同应用中的物理互动,包括摩托车风挡湍流。 在该模拟中,OpenFOAM能够计算摩托车和骑手周围的稳定气流。OpenFOAM能够根据用户指定的进程数进行负载均衡计算,以此将网格分解成多个部分并分配给不同的进程求解。求解完成后,再将网格和解重新组合为单个域。 该工作负载使用的软件堆栈 OpenFOAMCFD软件(版本8),其中摩托车网格尺寸为:600x240x240 Alma9Linuxkernel5。14 OpenMPIv4。1。1 测试设置 DDR4系统搭配第三代64核3。7GHzAMDEPYC处理器;DDR43200MHz系统2的RDIMM内存槽插满,共64GB DDR5系统搭配第四代96核3。7GHzAMDEPYC处理器;DDR54800MHz系统3的RDIMM内存槽插满,共64GB 测试结果 测试结果表明美光DDR5产品组合将OpenFOAM性能提高了2。4倍。OpenFOAM为五大高性能计算软件平台之一,拥有大型开源社区。该软件广泛应用于大学和研发中心,可利用高带宽内存和拥有密集内核的高性能CPU,实现高度的并行操作。 CP2K是一款开源量子化学工具,适用于许多应用,包括固态生物系统模拟。CP2K能够为不同的建模方法提供通用的框架。此次测试对象为水(H2O)的密度泛函理论(DFT),模拟盒子中共包含6,144个原子(2,048个水分子)。 该工作负载使用的软件堆栈 H2ODFTLS。NREP4及H2ODFTLS Alma9Linuxkernel5。14 测试设置 DDR4系统搭配第三代64核3。7GHzAMDEPYC处理器;DDR43200MHz系统2的RDIMM内存槽插满,共64GB DDR5系统搭配第四代96核3。7GHzAMDEPYC处理器;DDR54800MHz系统3的RDIMM内存槽插满,共64GB 测试结果 测试结果表明美光DDR5产品组合将分子动力学性能提高了2。1倍。随着内核数和内存带宽增加,此类工作负载的性能也显著提升。 总结 目前只针对少量高性能计算工作负载进行测试,因此以上只是初步成果。将高性能高带宽内存与最新的服务器处理器(如第四代AMDEPYC处理器)相结合,可为高性能计算客户创造新的可能。 1在STREAM基准测试中配置了25亿个向量的STREAMBenchmark运行在一台单AMDCPU系统上 2AMDDDR4系统为一台64核AMDEPYC7763处理器,DDR43200MHz的RDIMM内存槽插满,共64GB 3AMDDDR5系统为一台96核AMDEPYC9654处理器,DDR54800MHz的RDIMM内存槽插满,共64GB 4横向分辨率为12。5公里CONUS的WRF在DDR4系统上的运行时间为929秒,在DDR5系统上的运行时间为287秒(均包括存储器的输入输出时间)。该测试中WRF配置为2。5公里CONUS,测试结果为1。3567时间步秒,相比之下DDR4的运行时间为2。8533时间步秒。 5针对OpenFOAM,运行了三种变体: 5a:1004040runtimes,DDR4系统运行时间为1,144秒,DDR5系统运行时间为478秒 5b:1084646runtimes,DDR4系统运行时间为1,633秒,DDR5系统运行时间为698秒 5c:1305252runtimes,DDR4系统运行时间为2,522秒,DDR5系统运行时间为1,091秒 6分子动力学工作负载在DDR4系统上的运行时间为2,519秒,在DDR5系统上的运行时间为1,242秒