美國Aurora超級電腦突破ExaFLOPS 難奪Top500冠軍

Featured Image
美國阿貢國家實驗室(ANL)的Aurora超級電腦已正式突破ExaFLOPS(每秒千兆次運算)大關,但再次未能撼動橡樹嶺國家實驗室(ORNL)的Frontier系統,無法在今年春季Top500超級電腦排行榜上奪冠。勞倫斯利弗莫爾國家實驗室(LLNL)的El Capitan超級電腦預計最早將在今年秋季登上Top500榜單,這似乎意味著備受期待但延遲已久的Aurora系統可能永遠無法稱霸這個排行。

Aurora配備21,248顆英特爾使用高頻寬記憶體(HBM)的Xeon Max處理器和63,744顆GPU Max加速器,在去年交付給美國能源部(DoE)的阿貢國家實驗室時,人們預期這將成為美國有史以來最強大的超級計電腦。不過,在去年11月的Top500排行榜出爐時,阿貢實驗室僅讓Linpack程式運行在系統的一半左右的規模。即使性能只發揮了一半,這台機器還是展現了驚人的每秒585兆次(585petaFLOPS)的雙精度性能。而在本季的排行榜上,我們開始看到這個系統真正的實力。

這次看起來是使用全部的性能運轉,阿貢實驗室這次取得超過一個千兆次的性能(1 exaFLOPS0)的性能,使其正式成為第二個登上Top500公開超級電腦榜單的ExaFLOPS等級的系統。

當然,眾所周知,在ExaFLOPS(每科千兆次)運算方面,中國在秘密運行著數個這樣等級或更高的超級電腦,這是大家都知道的事實。隨著中美貿易關係繼續惡化,尤其是在高性能計算、人工智慧和半導體製造等領域,中國短期內恐怕不會揭露其ExaFLOPS系統的資訊。

英特爾的Aurora系統明顯落後於其他系統的方面之一是功耗。儘管使用了更現代的架構,但該機器遠非最節能的機器。突破ExaFLOPS大關需要高達38.6兆瓦的電力。作為參考,Frontier只需22.7兆瓦的電力就實現了1.2 exaFLOPS的性能。

儘管仍然無法與Frontier匹敵,但阿貢實驗室似乎還有很大的改進空間。目前,該實驗室僅實現了這台機器1.98 exaFLOPS理論峰值性能的一半多一點。經過發布後我們得知,Aurora達到1.01 exaFLOPS的分數是在機器運作了87%的情況下實現的。即使Aurora最終能夠超越Frontier,也還有一個更大、更強大的系統即將到來。LLNL的El Capitan超級電腦將是首批使用AMD的MI300A APU的系統之一。我們在AMD去年12月的發表會上詳細介紹了這些晶片,簡而言之,它們將三個Zen 4運算晶片(總共24個核心)與六個CDNA 3 GPU晶片整合到一個插槽中。GPU和CPU作為一個單元共享高達128GB的高速HBM3記憶體。El Capitan預計峰值性能為2.3 exaFLOPS,比Aurora高出近400 petaFLOPS(請記住,這是理論性能,並非實際性能),使其在理論上比日本超級電腦「Fugaku」快近一倍。

當然,正如Aurora的Linpack基準測試所表明的那樣,在如此大的規模上真正釋放全部運算能力是相當棘手的。所以,也許Aurora有機會在最後關頭奪冠。

Alps到來,Sierra從前10名滑落
雖然榜單上最強大的10個系統與去年11月相比基本沒有變化,其中Eagle、Fugaku和LUMI分別佔據第三、第四和第五名,但我們發現瑞士的Alps超級電腦取代了Leonardo,佔據了第六名。Alps以270 petaFLOPS的Linpack分數成為Top500榜單上使用Nvidia Grace-Hopper超級晶片的最強系統。Nvidia的GH200在2022年的GTC大會上亮相,並於今年早些時候開始交給客戶,它結合一個72核Arm處理器和480GB的LPDDR5x記憶體與一個H100 GPU和96GB到144GB的HBM3或HBM3e記憶體。

在Alps之後,Leonardo系統仍表現強勁。然而,位於第八名的西班牙MareNostrum 5 ACC超級電腦超越了英勇的Summit超級電腦,自去年秋天以來Linpack性能測試分數增加了38 petaFLOPS,達到175 petaFLOPS。但值得注意的是,因為儘管分數更高,這台機器的規模似乎比去年略有縮小,這次記錄的核心數量減少了17,920個。

第九和第十名分別是橡樹嶺國家實驗室的元老級超級電腦Summit和NVIDIA的Eos超級電腦(注意,不是那個配備10,000顆GPU的版本,那是一台不同的機器)。

隨著Alps系統的加入,勞倫斯利弗莫爾國家實驗室(LLNL)的Sierra超級電腦正式跌出前十名。這台由IBM的Power 9處理器和NVIDIA現在已略顯老舊的V100 GPU驅動的超級電腦,在過去六年裡一直保持在前十名的位置。

未來一年精彩不斷
儘管El Capitan可能會成為2024年的性能霸主,但隨著預計今年晚些時候上線的幾個備受矚目的超級電腦,Top500榜單可能會再次迎來洗牌。

其中規模最大的將是歐洲首台ExaFLOPS超級電腦Jupiter系統。目前尚不清楚該機器是否能趕上11月份的超級電腦大會(Supercomputing),但據報導,憑藉由SiPearl基於Arm架構的Rhea處理器支援的24,000顆GH200超級晶片,Jupiter將在實際的HPC工作負載中超過1 exaFLOPS的性能。

然後是英國的Dawn和Isambard-AI系統。據報導,Dawn採用與Aurora相似的設計,建成後將擁有超過10,000顆GPU,理論峰值性能達到532 petaFLOPS。與此同時,布里斯托大學的Isambard-AI預計峰值FP64性能將超過200 petaFLOPS。

我們也很有可能看到更多基於雲端的系統,例如微軟的Eagle,登上Top500榜單。隨著GPU運算集群、雲端服務商和超大規模廠商部署數萬顆用於人工智慧的GPU(Meta今年計畫部署350,000顆H100),毫無疑問,這些系統一定都有人至少會運行一次Linpack基準測試。

Share this content: