通过第三代AMD EPYC处理器的详细技术解析,我们可以看出全新的Zen 3架构让第三代AMD EPYC处理器的浮点性能、分支预测能力、安全性等方面均有了非常明显地提升。通过架构设计的改进,AMD宣称第三代AMD EPYC处理器的IPC比上一代产品提升高达19%。那么第三代AMD EPYC处理器在实际应用中的性能究竟提升了多少呢?下面我们就来看看其测试成绩。
参测处理器规格解析
MC本次测试的对象是AMD EPYC 7763、EPYC 7713、EPYC 75F3这3款处理器,下面我们首先来看看它们的规格参数。EPYC 7763是第三代AMD EPYC处理器中综合性能最强的一款产品,它采用64核128线程设计,基准频率为2.45GHz,Boost频率最高可达3.5GHz,TDP为280W。EPYC 7713同样采用64核128线程设计,其频率设定是2.0GHz~3.675GHz,相比EPYC 7763,前者的基础频率稍低,但后者的Boost加速频率要更高一些。
此外,EPYC 7713的TDP为225W,比EPYC 7763更低一些,所以前者更适合应用在需要更强单核计算性能和更低功耗的场景。第三代AMD EPYC处理器中包含4款命名带有“F”的产品,采用这种命名方式的主要目的是突出它们拥有更高的单核心Boost频率,而在这4款产品中,EPYC 75F3的综合性能最强。它采用32核64线程设计,基础频率为2.95GHz,Boost频率高达4.0GHz,TDP则为280W,它更适合应用在一些对处理器频率要求较高的场景中。
当然,以上3款处理器均由经过升级的台积电7nm工艺打造,并基于AMD最新推出的Zen 3架构,它们均拥有容量高达256MB的三级缓存,同时最高支持8通道DDR4 3200内存,内存带宽(每路)高达204.8GB/s。
▲本次测试选择的是AMD EPYC 7763、EPYC 7713、EPYC 75F3这3款处理器(图为EPYC 7713和EPYC 75F3)
性能测试
首先我们来了解一下测试平台。本次测试统一考察的是双路系统的性能,并且统一使用的是AMD DAYTONA_X主板,搭配DDR4 3200内存(32GB×16)。为了让大家对第三代AMD EPYC处理器的性能有更加直观的认识,MC还会将EPYC 7763、EPYC 7713、EPYC 75F3这3款处理器的测试成绩与第二代AMD EPYC处理器的旗舰级产品EPYC 7742进行对比。需要说明的是,由于C-Ray 1.1和Sysbench的测试方法更新,EPYC 7742的测试成绩不再具备对比性,所以在这两项测试中,我们将重点考察EPYC 7763、EPYC 7713、EPYC 75F3这3款处理器的性能表现。
第三代AMD EPYC处理器双路系统测试平台一览
处理器:EPYC 7763×2
EPYC 7713×2
EPYC 75F3×2
内存:美光DDR4 3200 ECC 32GB×16
主板:AMD DAYTONA_X(BIOS版本:RYM1001D)
硬盘:三星860 PRO 256GB SSD×2
操作系统:Ubuntu 20.04
EPYC 7742双路系统测试平台一览
处理器:EPYC 7742×2
内存:美光DDR4 3200 ECC 32GB×16
主板:AMD DAYTONA_X(BIOS版本:RDY1001C)
硬盘:美光9300 3840GB SSD×3
操作系统:Ubuntu 19.04(用于测试SPECrate 2017)
CentOS 7.6(用于测试其他项)
▲测试平台均使用的是美光DDR4 3200 ECC内存(32GB×16)
SPECrate 2017
SPECrate 2017测试的是在单位时间内运行的实例数量,这是服务器采购时的主要性能指标,所以服务器厂商和处理器厂商通常提供的是这一测试成绩。在SPECrate 2017中包含SPECrate Integer和SPECrate Floating Point,前者测试的是整型并发性能,后者测试的是浮点并发性能。
测试成绩显示,相比双路EPYC 7742,双路EPYC 7763在SPECrate 2017中的性能提升非常明显。例如在SPECrate 2017_int_base中,双路EPYC 7763的得分为777分,领先双路EPYC 7742约14%。而在考察处理器浮点运算性能的SPECrate 2017_fp_base中,双路EPYC 7763的测试成绩为610分,以17%的性能优势大幅领先双路EPYC 7742。值得一提的是,SPEC的官网数据显示双路EPYC 7763的SPECrate 2017_fp_base和SPECrate 2017_int_base测试成绩比本次测试的结果更优秀—相比双路EPYC 7742,双路EPYC 7742的性能优势分别扩大到20%和17%。
EPYC 7713和EPYC 7742的TDP虽然都是225W,但得益于更先进的Zen 3架构和更高的Boost频率,双路EPYC 7713在SPECrate 2017中的表现全面领先双路EPYC 7742。其中,双路EPYC 7713的SPECrate 2017_int_base测试成绩领先双路EPYC 7742约9%,而在SPECrate 2017_fp_base中,双路EPYC 7713的性能优势更是达到14%。正如前文所述,EPYC 75F3是一款采用32核64线程的处理器,它却在SPECrate 2017中带来了亮眼的表现。首先,在SPECrate 2017_int_base中,双路EPYC 75F3的得分为556分,相比上一代旗舰级产品EPYC 7742组成的双路系统,前者仅落后约23%。更加喜人的是,在SPECrate 2017_fp_base中,双路EPYC 75F3的性能表现已经达到双路EPYC 7742的水准。
综合SPECrate 2017的测试成绩我们不难发现,第三代AMD EPYC处理器在浮点运算方面的性能提升非常喜人,这自然要归功于Zen 3架构在浮点计算部分的加强。同时,得益于更大的执行窗口,以及专用分支预测和地址选择器的加持,第三代AMD EPYC处理器在整数运算上的性能也得到增强,这一点也在SPECrate 2017的测试成绩中得到充分体现。
Stream-Traid
Stream是业界广为流行的综合性内存带宽实际性能测量工具之一。和硬件厂商提供的理论最大内存带宽不同,通过fortran和C两种高级且高效的语言编写完成的Stream,可以在测试中充分发挥出内存的能力。Stream一共包含Copy、Scale、Add和Triad这4种操作,其中Triad组合了前面3种操作,所以其测试成绩更具参考价值。
从规格参数我们可以看到,第三代AMD EPYC处理器的每路理论内存带宽和EPYC 7742保持一致。从我们的测试成绩来看,参测的3款第三代AMD EPYC处理器各自组成的双路系统,在这项测试中的实际内存带宽基本保持一致,同时还小幅领先双路EPYC 7742。
NAMD
NAMD是一种并行的分子动力学代码,由伊利诺伊大学厄巴纳-香槟分校贝克曼高级科学与技术研究所的理论和计算生物物理学小组开发,它主要用于大型生物分子系统的高性能模拟。本次测试中,我们主要通过NAMD来考察参测处理器的浮点性能。
从我们的测试结果可以看到,在核心数和线程数相同的情况下,得益于更高的基础频率,以及浮点性能上的提升,双路EPYC 7763在NAMD中以3%左右的优势胜过双路EPYC 7742。此外,测试成绩显示双路EPYC 7713的表现要比双路EPYC 7742稍逊一筹,我们认为这是EPYC 7713的基础频率比EPYC 7742稍低一些所致。
OpenSSL
OpenSSL广泛用于保护服务器之间的通信,这是许多服务器堆栈中的重要协议。OpenSSL测试主要包含生成签名和验证签名两部分,我们在本次此时中主要进行了OpenSSL生成签名测试。
双路EPYC 7763在我们的测试中每秒钟可生成27163.2个签名,其签名效率比双路EPYC 7742快2%左右。此外,即使EPYC 75F3的核心数和线程数仅为EPYC 7742的一半,但EPYC 75F3处理器的“高频”特点让它在OpenSSL中表现不俗—双路EPYC 75F3在本次测试中生成签名的效率可以达到双路EPYC 7742的66%左右。
UnixBench Dhrystone 2和 Whetstone测试
本项目主要用于测试Unix系统性能,其中包括测试字符串处理的Dhrystone 2 using register variables和测试浮点操作速度和效率的Double-Precision Whetstone这两个测试项目。此外,在这两个测试项目均可选用单线程或多线程进行测试,本次测试我们使用的是多线程。
C-ray 1.1
C-ray是一种常用的光线追踪基准测试,可以显示多线程工作负载下处理器的差异,时间越短说明系统性能越强。在本次测试中,我们使用了4K和8K这两种分辨率进行测试,从而对比参测系统在不同负载下的性能差异。
得益于较高的核心频率,双路EPYC 75F3在C-ray中的表现比较亮眼。虽然其核心数和线程数仅为双路EPYC 7763的一半,但得益于较高的核心频率,双路EPYC 75F3在4K分辨率下完成测试任务仅比双路EPYC 7763多耗时约1秒,而且即使在8K分辨率下,双路EPYC 75F3完成测试任务的耗时也只是比双路EPYC 7763多耗时约6秒。
Sysbench CPU测试
Sysbench是一款被广泛使用的Linux基准测试,它可以对CPU进行性能测试,在测试中主要是通过CPU进行质数加法运算,质数极限为10000个。
我们的测试成绩显示,双路EPYC 7763每秒可完成487771轮运算,而双路EPYC 7713的性能约为双路EPYC 7763的92%。值得点赞的是,双路EPYC 75F3每秒也能完成304232轮运算,其性能约为双路EPYC 7763的62%左右。虽然EPYC 75F3的核心数和线程数仅为EPYC 7763的一半,但我们认为更高的基础频率是前者的“加分项”。
HPL
HPL的英文全称为“High-Performance Linpack”,Linpack是国际上一款用于测试高性能计算机系统浮点性能的基准测试工具。通过对高性能计算机采用高斯消元法求解一元N次稠密线性代数方程组的测试,考量高性能计算机的浮点性能。
测试成绩显示,双路EPYC 7763在HPL中的性能表现领先EPYC 7742约5.2%,双路EPYC 7713在这项测试中的性能约为双路EPYC 7763的84%,而双路EPYC 75F3的性能则约为双路EPYC 7763的67%。
提供领先性能,扩大竞争优势
总览本次测试结果我们不难看出,Zen 3架构让第三代AMD EPYC处理器的综合性能得到大幅增强。例如,在保持核心数和线程数相同的情况下,双路EPYC 7763在浮点运算性能相对双路EPYC 7742有了跨越式的提升。同时即使核心数和线程数仅为双路EPYC 7742的一半,但双路EPYC 75F3的浮点性能也可以与之媲美。
得益于更大的执行窗口,以及专用分支预测和地址选择器的加持,第三代AMD EPYC处理器在整数运算上的性能也得到增强,这一点也在本次测试中得到充分体现。此外,第三代AMD EPYC处理器提升了三级缓存应用和内存配置上的灵活性,以及大幅增强的安全性。不仅如此,第三代AMD EPYC处理器还针对不同客户、不同场景推出了包含“F”系列产品在内的多个细分产品线,共计19款产品,整个产品布局非常完善。
随着第三代AMD EPYC处理器的推出,与上一代处理器相比,AMD的可用解决方案数量增加了一倍以上,包括用于超融合基础设施、数据管理、数据分析和HPC的领先解决方案,为客户提供卓越的性能、安全特性及其价值。不仅如此,在COMPUTEX 2021上,AMD总裁兼首席执行官苏姿丰博士(Dr. Lisa Su)展示配置了EPYC 7763的双路服务器,对比至强铂金8380,在有关电子商务负载上执行了Java Operations Per Second测试。这个测试的主要目的是为了呈现服务器在每秒响应能力方面的性能。实际测试表明,双路Xeon 8380在每秒操作数达到201334的峰值后就无法完成更高的负载。相比之下,使用了EPYC 7763的双路服务器,轻松达到了301297的计算峰值,超越双路至强铂金8380接近50%,显示了EPYC 7763处理器强大的计算能力。综上我们不难看出,第三代AMD EPYC处理器可以帮助企业用户从容应对各种复杂的IT挑战,并成为AMD继续扩大竞争优势的新一代战略性产品。
▲Lisa Su在COMPUTEX 2021上展示第三代 EPYC在电子商务应用中的业务交付能力,比友商最强的双路系统高50%。