采用英特尔PonteVecchio的Aurora超级计算机未能在百亿亿次级竞赛中击败所有AMD前沿产品

导读 昨天,Top500.org发布了地球上最快的超级计算机列表,看起来英特尔的Aurora超级计算机未能击败AMD的Frontier,这是唯一一台完全运行的百亿...

昨天,Top500.org发布了地球上最快的超级计算机列表,看起来英特尔的Aurora超级计算机未能击败AMD的Frontier,这是唯一一台完全运行的百亿亿次计算机。

忘掉Zettascale吧,英特尔尚未通过Aurora超级计算机和PonteVecchio芯片实现百亿亿次性能,全AMDFrontier是地球上唯一的Exaflop+系统

为美国伊利诺伊州阿贡领导计算设施的Aurora超级计算机提供动力的英特尔PonteVecchio加速器现已投入运行,但承诺的计算性能远未实现,因为该系统的运行速度仅为预期计算输出的四分之一。无论是在原始性能还是原始效率方面,AMDFrontier系统都击败了英特尔的Aurora系统。

以下是全球排名前三的超级计算机:

Frontier仍然是TOP500中排名第一的系统。该HPECrayEX系统是美国第一个性能超过1Exaflop/s的系统。它安装在美国田纳西州橡树岭国家实验室(ORNL),由能源部(DOE)运营。目前,它使用8,699,904个内核实现了1.194Exaflop/s。HPECrayEX架构结合了针对HPC和AI优化的第三代AMDEPYCCPU、AMDInstinct250X加速器和Slingshot-11互连。

Aurora凭借在整个系统的一半上测得的585Pflop/s的HPL分数获得了第二名。它安装在美国伊利诺伊州阿贡领导计算设施,该设施也由能源部(DOE)运营。这个新的英特尔系统基于HPECrayEX-英特尔百亿亿次计算刀片。它使用英特尔至强CPUMax系列处理器、英特尔数据中心GPUMax系列加速器和Slingshot-11互连。

新的3号系统Eagle由微软安装在其Azure云中。该MicrosoftNDv5系统基于XeonPlatinum8480C处理器和NVIDIAH100加速器,获得了561Pflop/s的HPL分数。

因此,从细节开始,Aurora超级计算机混合使用了IntelXeonMax“第四代SapphireRapids”和DataCenterMaxGPU“PonteVecchio”。该系统共有474.2万个核心,远低于系统预期的最终数字。该系统输出的峰值FP64计算性能为585.34PFLOPs,不到基于AMD的Frontier峰值性能(Rmax)的一半,Frontier是唯一具有exaflop能力的机器,达到1,194PFLOPs。该系统自2022年起开始运行。

在效率方面,Aurora超级计算机的峰值Rpeak为1059.33PFLOP/s,而Frontier超级计算机的峰值为1,679.82PFLOP/s。Aurora超级计算机的峰值功耗为24.6MW,但这是整个系统的数字,而不是使用一半规格/硬件运行的当前配置。Frontier超级计算机的功耗为22.7MW。

R峰值是使用公布的CPU时钟速率计算的。为了提高系统效率,您应该考虑适用的TurboCPU时钟速率。

奥罗拉(Aurora)现在的状态并不奇怪。尽管该系统最终投入运行,但距离英特尔承诺的2Exaflops还差得很远。目前的情况部分是由于英特尔的SapphireRapids和PonteVecchio芯片的严重延迟导致AMD在百亿亿次竞赛中占据第一,并保持了一整年。英特尔Aurora早在2019年(四年前)就首次亮相。但如果你想真正回到过去,那么Aurora的原始设计早在2015年就已制定,预计于2018年推出。当时,它是一个180PFLOPs系统,基于现已停产的XeonPhi”骑士山”平台。

目前尚不清楚我们何时会看到Aurora最终推出2Exaflops的计算能力,但AMD已经在计划推出名为El-Capitan的2Exaflop+系统,该系统也应该在来年投入运行。这将进一步削弱英特尔在高性能计算和超级计算领域的影响力。

英特尔确实宣布了另外两台超级计算机:Dawn(英国剑桥大学)和SuperMuc-NG(LRZ,德国)。该公司还分享了Aurora节点与Frontier和Polaris的一些性能数据,但我相信,当Frontier在Top500列表中领先整体性能数据时,这些数据并不重要。

AMD已经领先,为全球140多台超级计算机提供支持,并且凭借其强大的EPYC(霄龙)和即将推出的看起来非常强大的Instinct产品,该名单将继续扩大。