与相同功率下的AMDGenoa和IntelSapphireRapidsx86芯片相比NVIDIAGraceCPU的性能高达2倍

摘要 与相同功耗下的AMDGenoa和IntelSapphireRapidsx86芯片相比,NVIDIAGraceCPU的性能高达2倍1NVIDIA公布了即将推出的基于Arm的GraceGPU的新基...

与相同功耗下的AMDGenoa和IntelSapphireRapidsx86芯片相比,NVIDIAGraceCPU的性能高达2倍1

NVIDIA公布了即将推出的基于Arm的GraceGPU的新基准,该GPU将为下一代数据中心和服务器提供动力。

NVIDIA最新的GraceCPU基准测试显示,在相同功率下,AMD和英特尔最快的x86数据中心CPU的性能高达2倍

GraceCPU由ArmNeoverseN2内核提供支持,将用于NVIDIA的超级芯片,有CPU+CPU和CPU+GPU两种类型。NVIDIA最近宣布了其用于人工智能和计算工作负载的最强大GPUGH200,它还配备了世界上最快的HBM3e内存,并将被GraceHopperSuperchip采用。

相关报道AMDRyzenThreadripperPRO7975WXCPU被发现:32个Zen4核心提供巨大​​的性能飞跃

Grace的一些主要亮点包括:

适用于HPC和云计算的高性能CPU

超级芯片设计,多达144个Armv9CPU内核

全球首款带ECC内存的LPDDR5x,总带宽1TB/s

SPECrate2017_int_base超过740(估计)

900GB/s相干接口,比PCIeGen5快7倍

封装密​​度是基于DIMM的解决方案的2倍

每瓦性能是当今领先CPU的2倍

运行所有NVIDIA软件堆栈和平台,包括RTX、HPC、AI和Omniverse

在HotChips2023演示中,NVIDIA首席科学家BillDally介绍了NVIDIAGraceSuperchip与其竞争对手的双路x86解决方案之间的性能比较。其中包括AMD的EPYC9654,它是最快的96核和192线程解决方案,还有英特尔的旗舰产品XeonPlatinum8480+,它具有56核和112线程。由于解决方案在双插槽配置上运行,因此AMD平台共有192个核心,英特尔平台共有112个核心。

从NVIDIAGraceCPU官方规格中我们得知,GraceSuperchip总共提供144个(每芯片72个ArmNeoverseV2)核心,支持高达960GB的LPDDR5X内存和高达1TB/s的原始带宽,并具有综合功耗为500W。其他规格包括117MBL3缓存和58个Gen5通道,同时使用TSMC4N工艺节点。

NVIDIA选择的基准测试涵盖了广泛的服务器应用程序,例如WeatherWRF、MDCP2K、ClimateNEMO、CFDOpenFOAM和GraphAnalyticsGapBSBFS。在所有基准测试中,NVIDIA的GraceSuperchipCPU的性能比AMD的GenoaCPU高出40%,同时远远领先于英特尔的SapphireRapidsCPU。大多数基准测试与Genoa相当,这对Grace来说也很好,因为其中两个芯片的总TDP为640W(每个EPYC9654为320瓦),而GraceSuperchip的运行功率为500W。

然而,与实际的大型数据中心应用程序相比,性能比较变得更加有趣。5MW数据中心吞吐量基准测试表明,NVIDIA的GraceSuperchips可以提供高达2.5倍的性能,同时在相同基准测试中效率极高。对于投资于这些工作负载的数据中心和服务器客户来说,GraceCPU可以成为一个重大的游戏规则改变者,就像NVIDIA的TensorCoreGPU主导了HPC和AI领域一样。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。