美国重夺全球超算第一!Frontier屠榜全球Top500

今日头条
Toutiao
最新回复:2022年5月31日 15点12分 PT
  返回列表
81741 阅读
39 评论
新智元

【新智元导读】最新超算Top500榜单揭晓!美国的性能怪兽Frontier以横扫之势拿下第一,算力超过身后468台的总和。已经霸榜两年,完成四连冠的日本富岳终于跌落了「神坛」。

在刚刚公布的2022年全球超算Top500名单中,美国橡树岭国家实验室(ORNL)的Frontier夺得第一。

凭借1.102 Exaflop/s的HPL分数,Frontier不仅是有史以来最强大的超级计算机,它也是第一台真正的「E级超算」。

相比之下,中国的神威·太湖之光和天河二号排名下滑至第六和第九。

去年,美国将神威·太湖之光的处理器供应商申威列入了实体清单,或多或少给中国超算的发展造成了影响。

这次Top500的64位浮点计算总算力为4.4 exaflops,比六个月前的上一期榜单增长了44.7%。

Frontier:突破百亿亿次

那么,Frontier的性能到底达到了怎样「逆天」的程度呢?!

简单来说,就是把排在它之后的468个超算的算力加起来,都比不过一个Frontier。

除了如此炫目的算力之外,Frontier还是全球跑AI最快的超级电脑之一。在HPL-AI基准的混合精度性能测试中,Frontier跑出了6.88 ExaFlops的成绩。

用白话说,这个性能相当于,给一个860亿神经元组成的智能体中的每个神经元,每秒都下达6800万个指令。

用这个训练AI大模型,那可真是火箭发动机搭上了一级方程式赛车,可以直接在赛道上起飞。

全新的Frontier占地372平方米,由74个HPE Cray EX机柜组成,可容纳9408个节点。

其中,每个节点有一个AMD Milan 「Trento」 7A53 Epyc CPU,搭配512GB DDR4内存和4个AMD Radeon Instinct MI250X GPU。

总的来说,该系统有602,112个CPU核心,与4.6PB的DDR4内存相连接。

此外,37,888个AMD MI250X GPU具有8,138,240个核心,并搭配了4.6PB的HBM内存(每个GPU有128GB)。

CPU和GPU使用基于以太网的HPE Cray Slingshot-11网络结构进行连接。

储存上则与一个性能极佳的存储子系统相连,有着700PB的容量,75TB/s的吞吐量和150亿IOPS的性能。

元数据层分布在480个NVMe SSD上,提供10PB的整体容量,而5400个NVMe SSD为主要的高速存储层提供11.5PB的容量。

同时,47,700个PMR硬盘提供679PB的容量。

散热方面,基于水冷的系统让6000加仑的水在350马力的泵在整个系统中「移动」,由此将温度控制在了85度左右。

直观来说,这些水泵可以在30分钟内填满一个奥林匹克标准游泳池。

Frontier不仅是现在世界上最快的超算,也是最环保的超算。

Frontier的能耗比,亦居全球超算的环保程度Green500榜单之首。单个由第三代AMD的Epyc处理器与Instinct MI250x加速器组建的机柜单元,其能耗效率是每瓦电能运算62.68 gigaflops。

不过,想把Frontier组装起来可不容易,ORNL必须采购685个不同编号的6000万个部件。

此外,在建造过程中还不得不去应对芯片的短缺。

ORNL受影响的零件编号有167个,算下来是200万个零件。而AMD缺少MI200 GPU的15个编号的零件。

于是ORNL与ASCR合作,为这些零件获得了国防优先权和分配系统(DPAS)评级,这意味着美国政府可以使用年度的防务预算,用显著高于市场价的更优厚价格来采购这些部件。

很快,「短缺」的问题也就得到了解决。

经过这波操作,是不是可以解开很多人心中所谓的「疑惑」了呢?

美国:为了我们的国防事业,加大力度搞超算!

虽然这么花钱,但用处不可谓不广。在英伟达老黄这种财主老爷都要做地球数字孪生体的时代,各国官方部门的超级计算机在开发处理庞大数据的AI、模拟气候和产业用途等方面越来越重要。

就算橡树林自己用不完这算力,也可以租、售嘛,工业界对算力可是嗷嗷待哺。

而且这已有他国先例:在预测机床材料加工结果的实验中,日本DMG森精机床自带工业电脑需要8小时,但富岳只需要10分钟就完成了。

中国:玩你们的,我就看看

在新一期榜单上,中国和美国仍然是上榜最多的国家。

在上榜超算数量上,中国仍为173台,和上期持平,继续位列榜首。美国从上期的150台下降到127台,排名次席。尽管如此,这两个国家仍然占了TOP 500榜单总数的60%。

日本、德国、法国分别以34、31、22台位列3-5位。

虽然此次Frontier正式成为世界上最强大的超级计算机,但它还没有与去年被曝光的两个中国超算进行比较。

不过,这两个系统目前都没有向Top500提交测试数据。

根据爆料的数据,有不少外媒推断Sunway OceanLight(神威·海洋之光)超级计算机在HPL基准上的峰值约为1.3 exaflops/1.05 exaflops,而天河三号则能够达到1.7 exaflops峰值/1.3 exaflops持续值。

然而,考虑到美国在芯片上的各种「卡脖子」,中国超算刷榜的后果很有可能就变成了一个制裁的「靶子」,想必短时间内应该不会看到任何有关数据的更新了。

上榜数量占比上,中国以34.6%的比例占据榜首,美国以25.4%的比例位列第二,中美争霸的态势依旧。

而在总性能排行榜上,美国的优势仍然不可动摇,以47.3%的总算力牢牢占据首位,不难看出,此次登顶的Frontier为美国稳定霸榜贡献不小。

此外,此次Top 500榜单还统计了自1990年起超算算力的进步趋势,并进行了线性回归。

表中横轴为时间,纵轴为算力(取对数)。

绿色点为上榜超算的总算力,黄色三角为榜单冠军的算力,蓝色方块为榜单倒数第一(第500名)超算的算力。对应颜色的直线为线性回归的结果。

可以看到,这三条直线大致符合摩尔定律的对算力提升的预测性判断。

都说摩尔定律已死,看起来在超算领域,它还活的很好很健壮。

欧洲崛起:Top10占据7席美国并不是唯一取得显著成绩的地区。欧洲也表现良好,从总排名上看,美、中、日占据前3,前十中剩余的七席则全部为欧洲国家占据。

其中德国上榜31台,法国上榜22台,意大利上榜14台。

芬兰新部署的LUMI超级计算机以151.9 petaflops的FP64性能勉强超过美国的Summit,获得第3名。

另外,法国GENCI-CINES的Adastra以46.1 petaflops的性能险些夺得第10名。虽然远不及LUMI强大,但Adastra仍然保持着欧洲第二强大的超级计算机的殊荣。

LUMI和Adastra等系统也说明了另一个趋势。与Frontier一样,它们基于HPE的全AMD Cray EX平台,使用第三代Epyc CPU和Instinct GPU。

为啥不用GPU加速:还是差钱长久以来,AMD第一次在Top500中的系统内的主机CPU中占有代表性的份额,但英特尔至强处理器仍然占主导地位。

从本世纪初开始,英特尔在高性能计算领域开始发力,只用了几年时间,就将IBM、惠普等几家之前的主要玩家排挤得元气大伤。

从2017年到2020年,英特尔在高性能计算领域达到极盛的市场占有率一度超过90%。

直到目前,英特尔的份额仍高达77.4%,下降了4.2个百分点,而AMD的份额正好上升了这个数字。预计Epycs会在与Xeon SP的竞争中获得更大的动力。

而且,AMD有后来居上的势头。在2022年的全球超算Top500榜单中,现在有94台超算依赖AMD的产品,年度增长95%。而且AMD的 Instinct MI200 加速器首次被其中7台超算采用。

另一个问题是,为什么不用GPU加速器?可能是因为贵?

GPU加速器作为计算引擎,可以提升巨大的性能和性价比,但目前,加速器并没有在Top500榜单上的超算架构中占据主导地位。这些GPU加速器主要是英伟达的。

但是,除了英伟达自家的HPC中心有大量应用需要移植到GPU上,而且不差钱之外,世界上成千上万的其他HPC中心还是差钱的,这些HPC的代码是明确为CPU编写的。

目前的Top500榜单中,只有170台超算采用了GPU加速器--当然大部分来自英伟达。

另一个因素是,更便宜的CPU本身现在也在陆续添加类似于GPU的加速计算功能,比如向量和现在的矩阵计算等。

这样就比将CPU程序转移至GPU运行更省钱,也更容易编程。我们可能永远不会看到一个主要由GPU加速系统组成的Top500榜单了。

事实上,在「富岳」、「太湖之光」这样排名靠前的超算系统中,CPU基本上充当了具备向量和矩阵计算型GPU的作用。

深圳足球
1 楼
牛鞭牛蒡大牛子
2 楼
瞧你那高兴劲,中国都宣布不参与评比了
无敌小馒头
3 楼
为了跑hpl可以堆核, 只要负担的起能耗。 这最新的top1对中国的提醒是, 一,硬件是商业硬件, 减轻硬件和软件的适用性开发。 二, 功耗效率高。
s
samkuhai
4 楼
恭喜美国。。能用政治解决的科技创新排名,为啥要让科学家累秃头? 政治家去解决,也就是签个字的事情。。全世界应该学习美国这种聪明做法。
W
Wuyueshanren
5 楼
美国🇺🇸好
小肥圆嫌二
6 楼
中国换赛道了吧。
g
gamma
7 楼
拿去挖矿赚钱 -bitcoin-
东方红NO1
8 楼
中国也有两台E级超算啊 只不过没参加评比罢了
g
googlebot
9 楼
中国保存实力,
左中右
10 楼
黄狗可以集体高潮了
大师兄的金箍棒
11 楼
五毛的玻璃心碎了一地
大师兄的金箍棒
12 楼
不比赛就不会输,不开战纸老虎就可以继续装,中国特色嘛
城市沉睡
13 楼
这跟五毛没啥关系,跟中国人有关系吧? 你们不打算假装“反共不反华”了? 不反华应该希望中国很快夺回世界第一吧? 另外, 中国其实有2个超级选手没出手呢。你不反华不是应该衷心希望那些个超级选手碾压美国的机器?
T
Tulanian
14 楼
嘿嘿,美国输不起去年就把中国两个超算中心就列为制裁名单。而中国两个E级超算中心已经运行快一年了……
摸金天师
15 楼
中国两台运行了一年的E级超算就在边上静静地看着你们装逼。
人生没有智慧
16 楼
去年,美国将神威·太湖之光的处理器供应商申威列入了实体清单,或多或少给中国超算的发展造成了影响。 连个芯片都造不出来的国家,还鸡巴天天喊自己的超级计算机世界第一..
m
msft.ora
17 楼
是啊 的确造出太多反华蟑螂鸡巴毛狗屎黄吃屎蛆。只会舔屎
m
msft.ora
18 楼
人生没有智慧 就是一只反华蟑螂鸡巴毛狗屎黄吃屎蛆。只会舔屎
m
msft.ora
19 楼
蟑螂鸡巴毛狗屎黄吃屎蛆果然高潮舔屎💩
m
msft.ora
20 楼
舔屎 反华蟑螂鸡巴毛狗屎黄吃屎蛆永远第一
@
@又是我@
21 楼
中国在没有真正解决芯片问题之前暂时应该不会去更新数据
X
XXyourOO
22 楼
据说,美国的超级计算机,商业化运作非常成熟,这些被研制出来的超算巨无霸,一方面帮助美国在计算机领域保持霸主地位,另一方面,因为有成熟的商业运作,能得到良好的维护和商业创收,因此后劲十足。相比之下,中国的超算,都是政治运动式的形象工程,有点类似我们当年复习冲刺高考,考前拼了命,高考结束,过不了十天八天,就扔了个精光,再也无人问津,留给🕷去做窝!
红旗生产队
23 楼
傻屄日杂倭寇遗腹子Sibarouen,你妈烂血屄最好
红旗生产队
24 楼
傻屄台巴子猪猡抬头看看,说不关我事,然后低头继续啃屎
红旗生产队
25 楼
傻屄台巴子猪猡人生没有智慧,一个每天感染十万的傻屄诈骗岛,天天喊着TAIWAN CAN HELP !
大师兄的金箍棒
26 楼
对对对,我又乳滑了,不好意思又把你玻璃心碰碎了
j
jeffinvade
27 楼
: 看看中国计算机的功率 F1赛车的排量只有2.0升,想造一辆比F1马力大的引擎很容易,但要造一台比F1赛车引擎更高效的内燃发动机基本不可能。
t
tatat
28 楼
狗粮终于长出一口气。你们还不谢谢你们的干爹。
y
youmyyou2016
29 楼
哈哈哈,傻逼还真以为自己是个什么东西 有人care吗
j
jeffinvade
30 楼
: 就会两件事 1,顾左右而言其他 2,人身攻击 能不能有点新意,偶尔也就事论事一下,也让我开开眼界
c
causal
31 楼
估计永远看不到中国更新数据了
g
gengzhi
32 楼
和美日欧都翻脸了, 以后想拿技术几乎不可能。 弯道超车没戏了,以后只能靠自己了。 华为,超算都完了。 再过2年,差距就会非常明显了。
a
aqw
33 楼
美国的胜出是罗马皇帝对决将军角斗士的无耻暗算!
无敌小馒头
34 楼
超算根本不可能商业运行, 除非更改整个科研机构的经费方法。
无敌小馒头
35 楼
超算根本不可能商业运行, 除非更改整个科研机构的经费预算方法。
南京浪子燕青
36 楼
挖雷顶配。
小白猪
37 楼
你可能对超算商业化一无所知,超算应用在现代精密工业需求庞大,超算商业化基本模式出租超算时间,都是按小时来算的,价格是普通企业无法负担的,你可能不知道,pringle的薯片脆度都是超算计算出来的。
E
Edmondon
38 楼
SB自媒体屠你妈B,一个新闻一遍又一遍,浪费读者时间,小编你妈起床了吗
无敌小馒头
39 楼
: 本人就在欧洲一个超算中心工作。 商业化完全没有展开。 好多方面的原因。 研究机构的超算贵, 绝大部分都是支持其它学科的研究, 基本上供不应求, 也就没有空间给商用客户。 对现代精密工业没涉及, 不清楚。 我还以为matlab就够用了呢。 公司自营的超算中心,只有大型公司玩的起。 规模也不可能很大。 欧洲这边超算中心就是超算中心, 不像国内的搞一堆互联网中心也算超算中心。 任务类型完全不相同的。