由内容质量、互动评论、分享传播等多维度分值决定,勋章级别越高(),代表其在平台内的综合表现越好。
原标题:大缓存更强劲,搭载AMDMilan-X的浪潮GPU服务器NFA5深度评测
据近日业界发布的评测报告显示,以浪潮GPU服务器NFA5为平台,搭载2颗AMDMilan-XX运行常见的气象应用WRF和计算流体力学应用OpenFOAM作为性能基准测试,其性能相比搭载两颗Rome时的计算性能提升可高达80%。
NFA5是一款4U支持2颗AMDEPYC处理器和8颗双宽GPU卡,面向AI训练、推理、视频编解码等多种应用场景的GPU服务器。此次测试采用分别搭载2颗AMDMilan-XX、Milan和Rome的配置组合。
AMDMilan-X处理器最大的亮点,就是采用3D堆叠技术(3DV-Cache),在不改变处理器面积的前提下,可用L3缓存(SRAM)总数增加三倍。做个形象的比喻,这种3D堆叠技术就像将把相同面积的平房升级成三层小楼,通过纵向空间成倍扩展缓存数量。评测采用的NFA5平台是浪潮信息畅销海内外的弹性云AI服务器NF系列的全新产品,率先支持PCIe4.0技术,4U空间内可装载2颗采用7nm先进制程工艺的AMDEPYC处理器和8块PCIeGen4接口的AI加速卡,能够最大限度的发挥Milan-X处理器的极致性能。
WRF(TheWeatherResearchandForecastingModel),即天气预报模式,被誉为是次世代的中尺度天气预报模式,往往用于大范围高分辨的气候模拟,对系统的运算性能、内存的要求非常高;
OpenFOAM(OpenSourceFieldOperationandManipulation)是对连续介质力学问题进行数值计算的软件,经常应用于汽车仿真等行业,进行仿真计算需要处理大量的实时数据,所以对系统的计算能力、数据吞吐能力都有很高的要求。
基于浪潮NFA5评测报告显示,Milan-X处理器通过搭载3D堆叠技术获得更高的L3缓存,确实对计算性能有较大提升,而性能改进意味着企业可以在更少的服务器上运行相同的作业,消耗的功率也能有明显降低。如下是评测报告中的性能测试数据:
▶在WRF测试中,使用单节点相同核心数,以Rome处理器运行时间为基准,在Milan上的计算性能提升14%~27%,而在Milan-XX处理器上性能提升23%~34%。
▶在OpenFOAM基准算例motorBike测试中,使用不可压稳态求解器simpleFoam计算模拟摩托车和骑手周围空气的运动情况。同样以Rome处理器为基准,OpenFOAM在Milan处理器使用单节点相同核心测试性能提升23%~28%,在Milan-XX处理器上性能提升34%~80%。
在本次评测中也对NFA5有比较细致的介绍,据浪潮官网显示NFA5正在推出“超值机型限免试用”,对该GPU服务器感兴趣的不妨一试。如下是评测中对于浪潮NFA5的介绍:
NFA5采用分区散热设计,内置独立的CPU和GPU主板,且分别安装在不同的平面。从机箱内部结构来看,设计者将发热量高的的GPU放在了机箱上3U空间,CPU板处于机箱下1U,内置6对12个风扇模组配合导风罩,实现机箱内风道分流,正是基于这种独特分层散热设计,使得送测的NFA5服务器可以支持280W最高功耗的Milan-XX。系统设计支持32条DDR4ECC内存,支持LRDIMM/RDIMM,提供高达8T的本地内存,实现与MB超大L3cache间的高速数据交互。
NFA5采用了CPU直连GPU架构设计,率先支持PCI-E4.0技术,最大限度提升CPU与GPU间的带宽,降低通信延迟,达到最佳效能,为客户提供极致优化的算力。系统提供丰富的IO扩展能力,提供10个PCIe4.0X16扩展槽位,支持8个全高全长的GPU加速卡。提供灵活存储方案,可选前置12×3.5英寸硬盘或24×2.5英寸硬盘,提供超大的本地存储能力,同时最大可支持8个热插拔NVMeSSD全闪配置,提供存储到内存到L3cache的高速访存,可实现十倍于高端企业级SATASSD的IOPS性能,带来极致IO存储性能飞跃。
应国家法律要求,使用互联网服务需完成实名验证。为保障您账号的正常使用,请尽快完成手机验证,感谢您的理解和支持!