与相同功率下的AMDGenoa和IntelSapphireRapidsx86芯片相比NVIDIAGraceCPU的性能高达2倍
与相同功耗下的AMDGenoa和IntelSapphireRapidsx86芯片相比,NVIDIAGraceCPU的性能高达2倍1
NVIDIA公布了即将推出的基于Arm的GraceGPU的新基准,该GPU将为下一代数据中心和服务器提供动力。
NVIDIA最新的GraceCPU基准测试显示,在相同功率下,AMD和英特尔最快的x86数据中心CPU的性能高达2倍
GraceCPU由ArmNeoverseN2内核提供支持,将用于NVIDIA的超级芯片,有CPU+CPU和CPU+GPU两种类型。NVIDIA最近宣布了其用于人工智能和计算工作负载的最强大GPUGH200,它还配备了世界上最快的HBM3e内存,并将被GraceHopperSuperchip采用。
相关报道AMDRyzenThreadripperPRO7975WXCPU被发现:32个Zen4核心提供巨大的性能飞跃
Grace的一些主要亮点包括:
适用于HPC和云计算的高性能CPU
超级芯片设计,多达144个Armv9CPU内核
全球首款带ECC内存的LPDDR5x,总带宽1TB/s
SPECrate2017_int_base超过740(估计)
900GB/s相干接口,比PCIeGen5快7倍
封装密度是基于DIMM的解决方案的2倍
每瓦性能是当今领先CPU的2倍
运行所有NVIDIA软件堆栈和平台,包括RTX、HPC、AI和Omniverse
在HotChips2023演示中,NVIDIA首席科学家BillDally介绍了NVIDIAGraceSuperchip与其竞争对手的双路x86解决方案之间的性能比较。其中包括AMD的EPYC9654,它是最快的96核和192线程解决方案,还有英特尔的旗舰产品XeonPlatinum8480+,它具有56核和112线程。由于解决方案在双插槽配置上运行,因此AMD平台共有192个核心,英特尔平台共有112个核心。
从NVIDIAGraceCPU官方规格中我们得知,GraceSuperchip总共提供144个(每芯片72个ArmNeoverseV2)核心,支持高达960GB的LPDDR5X内存和高达1TB/s的原始带宽,并具有综合功耗为500W。其他规格包括117MBL3缓存和58个Gen5通道,同时使用TSMC4N工艺节点。
NVIDIA选择的基准测试涵盖了广泛的服务器应用程序,例如WeatherWRF、MDCP2K、ClimateNEMO、CFDOpenFOAM和GraphAnalyticsGapBSBFS。在所有基准测试中,NVIDIA的GraceSuperchipCPU的性能比AMD的GenoaCPU高出40%,同时远远领先于英特尔的SapphireRapidsCPU。大多数基准测试与Genoa相当,这对Grace来说也很好,因为其中两个芯片的总TDP为640W(每个EPYC9654为320瓦),而GraceSuperchip的运行功率为500W。
然而,与实际的大型数据中心应用程序相比,性能比较变得更加有趣。5MW数据中心吞吐量基准测试表明,NVIDIA的GraceSuperchips可以提供高达2.5倍的性能,同时在相同基准测试中效率极高。对于投资于这些工作负载的数据中心和服务器客户来说,GraceCPU可以成为一个重大的游戏规则改变者,就像NVIDIA的TensorCoreGPU主导了HPC和AI领域一样。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。